小编dhv*_*nyk的帖子

spotfire ironpython:将新行追加到数据表中

我有一个csv字符串输入
string_in="country,100,color"
任何人都可以建议我如何
使用spotfire中的ironpython脚本将此输入(string_in)附加到已存在的数据表可视化.
谢谢.

ironpython spotfire

dhv*_*nyk

lucky-day

3
推荐指数

1
解决办法

6756
查看次数

用于删除重复项的python脚本,需要24小时+循环遍历10 ^ 7条记录

输入t1
P95P,71655,LINC-JP,致病性
P95P,71655,LINC-JP,致病性
P71P,71655,LINC-JP,致病性
P71P,71655,LINC-JP,致病性

输出op
P95P,71655,LINC-JP,致病性
P71P,71655,LINC-JP,致病性

mycode的

def dup():
    fi=open("op","a")
    l=[];final="";
    q=[];dic={};
    for i in open("t1"):
        k=i.split(",")
        q.append(k[1])
        q.append(k[0])
        if q in l:
            pass
        else:
            final= final + i.strip() + "\n"
            fi.write(str(i.strip()))
            fi.write("\n")
        l.append(q)
        q=[]
        #print i.strip()
    fi.close()
    return final.strip()    
d=dup()

Run Code Online (Sandbox Code Playgroud)

在上面的输入行1,2和行3,4是重复的.因此,在输出中删除了这些重复项,输入文件中的条目大约为10 ^ 7.

为什么我的代码自24小时后运行以输入76Mb文件.它还没有完成整个输入文件的一次迭代.它适用于小文件.
任何人都可以指出这么长时间的原因.我如何优化我的程序？
日Thnx

python optimization

dhv*_*nyk

2014 06-27

2
推荐指数

2
解决办法

104
查看次数