在pandas中读取没有标题的制表符分隔数据

bio*_*ard 6 python tab-delimited dataframe pandas

我无法pandas在没有标题的情况下打开制表符分隔的数据.

我的测试数据(实际上包含200行,其中我显示的是前10行):

Tag19184    CTAAC   hffef   1   a   36  -   chr1    10006   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10012   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10018   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10024   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10030   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10036   0   36M 36
Tag19184    CTAAC   hffef   1   a   36  -   chr1    10042   0   36M 36
Tag20198    CTAAC   hffef   1   a   36  -   chr1    10048   0   36M 36
Tag20198    CTAAC   hffef   1   a   36  -   chr1    10054   0   36M 36
Tag45093    CTAAC   hffef   1   a   36  -   chr1    10060   0   36M 36
Run Code Online (Sandbox Code Playgroud)

我的代码:

import pandas as pd
df = pd.read_csv('in_test.txt',sep='\t',header=None)
print df
Run Code Online (Sandbox Code Playgroud)

但是,我得到以下输出,我认为我不能用它来进一步处理数据(?):

<class 'pandas.core.frame.DataFrame'>
Int64Index: 200 entries, 0 to 199
Data columns:
X.1     200  non-null values
X.2     200  non-null values
X.3     200  non-null values
X.4     200  non-null values
X.5     200  non-null values
X.6     200  non-null values
X.7     200  non-null values
X.8     200  non-null values
X.9     200  non-null values
X.10    200  non-null values
X.11    200  non-null values
X.12    200  non-null values
dtypes: int64(5), object(7)
Run Code Online (Sandbox Code Playgroud)

这里教程建议print df应该给我相应的数据框.我究竟做错了什么?

CT *_*Zhu 2

我认为您的阅读正确,但是:

  1. 请参阅:将 pandas 0.13.0“打印数据帧”更改为像早期版本中那样打印数据帧,这就是 pandas 在旧版本中所做的事情。所以,更新就能解决这个问题。
  2. 您可以使用ipython notebook, 其中DataFrames将显示为 HTML 表格。
  3. 您可以使用df.head(5)(类似于rs head)来获取前几行,以确保您的DataFrame正确性。