bio*_*ard 6 python tab-delimited dataframe pandas
我无法pandas在没有标题的情况下打开制表符分隔的数据.
我的测试数据(实际上包含200行,其中我显示的是前10行):
Tag19184 CTAAC hffef 1 a 36 - chr1 10006 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10012 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10018 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10024 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10030 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10036 0 36M 36
Tag19184 CTAAC hffef 1 a 36 - chr1 10042 0 36M 36
Tag20198 CTAAC hffef 1 a 36 - chr1 10048 0 36M 36
Tag20198 CTAAC hffef 1 a 36 - chr1 10054 0 36M 36
Tag45093 CTAAC hffef 1 a 36 - chr1 10060 0 36M 36
Run Code Online (Sandbox Code Playgroud)
我的代码:
import pandas as pd
df = pd.read_csv('in_test.txt',sep='\t',header=None)
print df
Run Code Online (Sandbox Code Playgroud)
但是,我得到以下输出,我认为我不能用它来进一步处理数据(?):
<class 'pandas.core.frame.DataFrame'>
Int64Index: 200 entries, 0 to 199
Data columns:
X.1 200 non-null values
X.2 200 non-null values
X.3 200 non-null values
X.4 200 non-null values
X.5 200 non-null values
X.6 200 non-null values
X.7 200 non-null values
X.8 200 non-null values
X.9 200 non-null values
X.10 200 non-null values
X.11 200 non-null values
X.12 200 non-null values
dtypes: int64(5), object(7)
Run Code Online (Sandbox Code Playgroud)
我认为您的阅读正确,但是:
ipython notebook, 其中DataFrames将显示为 HTML 表格。df.head(5)(类似于rs head)来获取前几行,以确保您的DataFrame正确性。| 归档时间: |
|
| 查看次数: |
8992 次 |
| 最近记录: |