我不知道是否有导入CSV文件的内容为记录阵列直接的方式,很多的方式是R的read.table(),read.delim()和read.csv()家庭的进口数据与R的数据帧?
或者是使用csv.reader()然后应用类似的东西的最佳方法numpy.core.records.fromrecords()?
我是python和pandas的新手.我正在尝试将tsv文件加载到熊猫中DataFrame.
这就是我正在尝试的错误和我得到的错误:
>>> df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
Traceback (most recent call last):
File "<pyshell#28>", line 1, in <module>
df1 = DataFrame(csv.reader(open('c:/~/trainSetRel3.txt'), delimiter='\t'))
File "C:\Python27\lib\site-packages\pandas\core\frame.py", line 318, in __init__
raise PandasError('DataFrame constructor not properly called!')
PandasError: DataFrame constructor not properly called!
Run Code Online (Sandbox Code Playgroud) 所以我对Python非常环保,并试图通过复制我编写的一些matlab代码来学习.我有一个部分,在matlab中,我加载了一个制表符分隔的数据文件.语法
x = load(data.txt)
Run Code Online (Sandbox Code Playgroud)
获取制表符分隔的数据并将其放入标记为x的矩阵的单元格中.
有没有办法在python中执行此操作,但使用逗号分隔的数据?
我有这样的数千个文件,我想提取对应于原子['CG','CD1','CD2','CE1','CE2','的行的列6,7,8的值. CZ'],
ATOM 1 CG TOLU 1 -0.437 -0.756 1.802 1.00 1.99 PRO0
ATOM 2 HG TOLU 1 -0.689 -1.123 2.786 1.00 0.00 PRO0
ATOM 3 CD1 TOLU 1 0.041 -1.623 0.811 1.00 1.99 PRO0
ATOM 4 HD1 TOLU 1 0.331 -2.603 1.162 1.00 0.00 PRO0
ATOM 5 CD2 TOLU 1 -0.692 0.547 1.352 1.00 1.99 PRO0
ATOM 6 HD2 TOLU 1 -1.131 1.264 2.030 1.00 0.00 PRO0
ATOM 7 CE1 TOLU 1 0.246 -1.276 -0.504 1.00 1.99 PRO0
ATOM …Run Code Online (Sandbox Code Playgroud) python ×4
numpy ×3
csv ×2
dictionary ×1
file-io ×1
genfromtxt ×1
pandas ×1
readlines ×1
scipy ×1
text ×1