Python Pandas read_csv无法正确导入

Question

Python Pandas read_csv无法正确导入

我有一个.xls看起来与此类似的文件......

Value of Construction Put in Place...
(Millions of Dollars....)
Blank Row
Date    Total_Construction Total Residential Total Nonresidential...Columns 
Dec-15  1,116,570          435,454           681,217 
Nov-15  1,115,966          432,295           683,671
Oct-15  1,122,749          431,164           691,585   
.
.
.

Run Code Online (Sandbox Code Playgroud)

我正在尝试导入该文件以获取以下内容:

Date    Total_Construction Total Residential Total Nonresidential 
Dec-15  1,116,570          435,454           681,217 
Nov-15  1,115,966          432,295           683,671
Oct-15  1,122,749          431,164           691,585   
.
.
.

Run Code Online (Sandbox Code Playgroud)

使用以下代码:

for chunk in pandas.read_csv('/PATH/totsatime.xls',
                 names      = ['Date', 'Total Residential', 'Total Nonresidential'],
                 header     = 4,
                 chunksize  = 1,
                 skiprows   = range(1, 4),
                 thousands  = ','):

    if chunk['Date'] == 'Dec-01':
        break

    else:
        df = pandas.DataFrame(chunk)

Run Code Online (Sandbox Code Playgroud)

但是,我最终得到以下结果:

Date             Total Residential     Total Nonresidential
Lodging          NaN                   NaN
Office          NaN                   NaN
Commercial      NaN                   NaN
Health care     NaN                   NaN

Run Code Online (Sandbox Code Playgroud)

日期最终将从我未导入的列格式化.任何建议将不胜感激.

先感谢您.

Answer 1

mh0*_*00h 5

不要read_csv用于导入xls文件.使用read_excel.见http://pandas.pydata.org/pandas-docs/stable/generated/pandas.read_excel.html

归档时间：	9 年，4 月前
查看次数：	323 次
最近记录：	9 年，4 月前