我正在使用该pandas模块从.csv文件中读取数据。
我可以写出以下代码来提取属于单个列的数据,如下所示:
import pandas as pd
df = pd.read_csv('somefile.tsv', sep='\t', header=0)
some_column = df.column_name
print some_column # Gives the values of all entries in the column
Run Code Online (Sandbox Code Playgroud)
但是,我现在尝试读取的文件有 5000 多列并写出语句
some_column = df.column_name
Run Code Online (Sandbox Code Playgroud)
现在不可行。如何获取所有列值以便我可以使用索引访问它们?
例如,要提取第 100 行和第 50 列的值,我应该可以这样写:
df([100][50])
Run Code Online (Sandbox Code Playgroud)
使用DataFrame.ilocor DataFrame.iat,但 python 从 开始计数0,因此需要99和49选择100.行和50.列:
df = df.iloc[99,49]
Run Code Online (Sandbox Code Playgroud)
示例 - 选择3.行和4.列:
df = pd.DataFrame({'A':[1,2,3],
'B':[4,5,6],
'C':[7,8,9],
'D':[1,3,10],
'E':[5,3,6],
'F':[7,4,3]})
print (df)
A B C D E F
0 1 4 7 1 5 7
1 2 5 8 3 3 4
2 3 6 9 10 6 3
print (df.iloc[2,3])
10
print (df.iat[2,3])
10
Run Code Online (Sandbox Code Playgroud)
可以通过Series.iloc或组合按列名和行位置进行选择Series.iat:
print (df['D'].iloc[2])
10
print (df['D'].iat[2])
10
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
11646 次 |
| 最近记录: |