使用python解析excel文档

tom*_*mes 43 python excel parsing

我想将excel文档解析为Python中的列表.有没有python库对这个动作有帮助?那个库中哪些功能相关?

Mar*_*ill 43

解析Excel文件最好是xlrd库.该python-excel.org网站有链接和实例xlrd和相关蟒蛇擅长库,包括PDF文档具有使用xlrd的一些很好的例子.当然,StackOverflow 上也有很多相关的xlrd问题可能会有用.

对xlrd库的一个警告是它只能使用xls(Excel 2003和早期版本的excel)文件格式,而不是更新的xlsx文件格式.有一个更新的库openpyxl用于处理xlsx,但我从未使用它.

更新:根据John的评论,xlrd库现在支持文件格式xlsxlsx文件格式.

希望有所帮助.

  • `xlrd`现在读取.xlsx和.xls文件. (8认同)
  • xlrd 不再支持 xlsx。最后支持 xlsx 的版本是 1.0.2 (4认同)

wor*_*ise 12

大熊猫库有一个快速简便的方法来读取Excel.如果它主要只是数据并且没有太复杂,它将起作用:

import pandas as pd
ex_data = pd.read_excel('excel_file.xlsx')
Run Code Online (Sandbox Code Playgroud)

它将其读入一个pandas DataFrame,这对于数据调整等很方便.

要去列表:

ex_data['column1_name'].values.tolist()
Run Code Online (Sandbox Code Playgroud)

如果每个工作表中有多个表和事物,那么您可能希望使用另一个库,如xlrd或openpyxl.


Ryu*_*usa 8

openpyxl是一个很棒的库,支持对2010 xlsx文件的读/写.

示例解析代码

from openpyxl import load_workbook
wb = load_workbook('Book1.xlsx')
ws = wb.active
for row in ws.iter_rows():
   for cell in row:
     print cell.value
Run Code Online (Sandbox Code Playgroud)

  • 并且是 python-excel.org 上推荐的库 (2认同)

Jam*_*ood 5

xlrd非常适合简单的任务,但如果您需要使用Excel的任何更深层功能(宏,高级绘图等),并且您正在使用Windows机器,则可以使用pywin32库来控制win32com层.这样可以访问几乎所有可以通过宏/ Visual Basic控制的内容.