tom*_*mes 43 python excel parsing
我想将excel文档解析为Python中的列表.有没有python库对这个动作有帮助?那个库中哪些功能相关?
Mar*_*ill 43
解析Excel文件最好是xlrd库.该python-excel.org网站有链接和实例xlrd和相关蟒蛇擅长库,包括PDF文档具有使用xlrd的一些很好的例子.当然,StackOverflow 上也有很多相关的xlrd问题可能会有用.
对xlrd库的一个警告是它只能使用xls
(Excel 2003和早期版本的excel)文件格式,而不是更新的xlsx
文件格式.有一个更新的库openpyxl用于处理xlsx
,但我从未使用它.
更新:根据John的评论,xlrd库现在支持文件格式xls
和xlsx
文件格式.
希望有所帮助.
wor*_*ise 12
该大熊猫库有一个快速简便的方法来读取Excel.如果它主要只是数据并且没有太复杂,它将起作用:
import pandas as pd
ex_data = pd.read_excel('excel_file.xlsx')
Run Code Online (Sandbox Code Playgroud)
它将其读入一个pandas DataFrame,这对于数据调整等很方便.
要去列表:
ex_data['column1_name'].values.tolist()
Run Code Online (Sandbox Code Playgroud)
如果每个工作表中有多个表和事物,那么您可能希望使用另一个库,如xlrd或openpyxl.
openpyxl是一个很棒的库,支持对2010 xlsx文件的读/写.
示例解析代码
from openpyxl import load_workbook
wb = load_workbook('Book1.xlsx')
ws = wb.active
for row in ws.iter_rows():
for cell in row:
print cell.value
Run Code Online (Sandbox Code Playgroud)
xlrd非常适合简单的任务,但如果您需要使用Excel的任何更深层功能(宏,高级绘图等),并且您正在使用Windows机器,则可以使用pywin32库来控制win32com层.这样可以访问几乎所有可以通过宏/ Visual Basic控制的内容.
归档时间: |
|
查看次数: |
69509 次 |
最近记录: |