我有一个csv字符串输入
string_in="country,100,color"
任何人都可以建议我如何
使用spotfire中的ironpython脚本将此输入(string_in)附加到已存在的数据表可视化.
谢谢.
输入t1
P95P,71655,LINC-JP,致病性
P95P,71655,LINC-JP,致病性
P71P,71655,LINC-JP,致病性
P71P,71655,LINC-JP,致病性
输出op
P95P,71655,LINC-JP,致病性
P71P,71655,LINC-JP,致病性
mycode的
def dup():
fi=open("op","a")
l=[];final="";
q=[];dic={};
for i in open("t1"):
k=i.split(",")
q.append(k[1])
q.append(k[0])
if q in l:
pass
else:
final= final + i.strip() + "\n"
fi.write(str(i.strip()))
fi.write("\n")
l.append(q)
q=[]
#print i.strip()
fi.close()
return final.strip()
d=dup()
Run Code Online (Sandbox Code Playgroud)
在上面的输入行1,2和行3,4是重复的.因此,在输出中删除了这些重复项,输入文件中的条目大约为10 ^ 7.
为什么我的代码自24小时后运行以输入76Mb文件.它还没有完成整个输入文件的一次迭代.它适用于小文件.
任何人都可以指出这么长时间的原因.我如何优化我的程序?
日Thnx
我是铁蟒蛇的新手。如果有人可以告诉我如何使用iron-python完全删除数据表,我将有义务?