从数据框中删除重复列的最简单方法是什么?
我正在通过以下方式阅读具有重复列的文本文件:
import pandas as pd
df=pd.read_table(fname)
Run Code Online (Sandbox Code Playgroud)
列名是:
Time, Time Relative, N2, Time, Time Relative, H2, etc...
Run Code Online (Sandbox Code Playgroud)
所有时间和时间相对列包含相同的数据.我想要:
Time, Time Relative, N2, H2
Run Code Online (Sandbox Code Playgroud)
我所有的删除,删除等尝试,例如:
df=df.T.drop_duplicates().T
Run Code Online (Sandbox Code Playgroud)
导致唯一值索引错误:
Reindexing only valid with uniquely valued index objects
Run Code Online (Sandbox Code Playgroud)
很抱歉是熊猫菜鸟.任何建议,将不胜感激.
额外细节
Pandas版本:0.9.0
Python版本:2.7.3
Windows 7
(通过Pythonxy 2.7.3.0安装)
数据文件(注意:在真实文件中,列由制表符分隔,这里它们用4个空格分隔):
Time Time Relative [s] N2[%] Time Time Relative [s] H2[ppm]
2/12/2013 9:20:55 AM 6.177 9.99268e+001 2/12/2013 9:20:55 AM 6.177 3.216293e-005
2/12/2013 9:21:06 AM 17.689 9.99296e+001 2/12/2013 9:21:06 AM 17.689 3.841667e-005
2/12/2013 9:21:18 AM 29.186 9.992954e+001 2/12/2013 9:21:18 …
Run Code Online (Sandbox Code Playgroud)