我想使用python的Pandas库读取.xlsx文件,并将数据移植到postgreSQL表. 
到目前为止我能做的就是:
import pandas as pd
data = pd.ExcelFile("*File Name*")
现在我知道步骤已成功执行,但我想知道如何解析已读取的excel文件,以便我可以理解excel中的数据如何映射到变量数据中的数据.
我知道如果我没错,数据就是一个Dataframe对象.那么我如何解析这个数据框对象以逐行提取每一行.
我有一个Excel文件
Arm_id      DSPName        DSPCode          HubCode          PinCode    PPTL
1            JaVAS            01              AGR             282001    1,2
2            JaVAS            01              AGR             282002    3,4
3            JaVAS            01              AGR             282003    5,6
我想在表单中保存一个字符串Arm_id,DSPCode,Pincode.此格式是可配置的,即它可能会更改为DSPCode,Arm_id,Pincode.我将格式保存在列表中
FORMAT = ['Arm_id', 'DSPName', 'Pincode']
如果可配置,我如何阅读具有提供名称的特定列的内容FORMAT.
这是我试过的.目前我能够阅读文件中的所有内容
from xlrd import open_workbook
wb = open_workbook('sample.xls')
for s in wb.sheets():
    #print 'Sheet:',s.name
    values = []
    for row in range(s.nrows):
        col_value = []
        for col in range(s.ncols):
            value  = (s.cell(row,col).value)
            try : value = str(int(value))
            except : pass
            col_value.append(value)
        values.append(col_value)
print …我正在做以下计算.
worksheet.write_formula('E5', '=({} - A2)'.format(number))
我想在控制台上打印E5中的值.你能帮帮我吗?是否可以使用Xlsxwriter或者我应该使用不同的库?
我喜欢一个很好的原生Python库来编写XLS,但它似乎并不存在.令人高兴的是,Jython确实如此.
所以我想在jexcelapi和Apache HSSF之间做出决定:http ://www.andykhan.com/jexcelapi/tutorial.html#writing http://poi.apache.org/hssf/quick-guide.html
(我不能使用COM自动化,因为我不在Windows上,即使我是,我也买不起Office许可证.)
我最初的想法是POI/HSSF非常彻底,但也非常Java--一切似乎都比它需要的更难.良好的文档,但我的头痛害试图弥合它描述的内容和我需要完成的之间的差距.
jexcepapi似乎有一个更简单,更好(对我来说)的界面,但没有很好的文档或社区.
你会用哪个,为什么?
有一种简单的方法,使用一些常见的Unix脚本语言(Perl/Python/Ruby)或命令行实用程序,将Excel电子表格文件转换为CSV?具体来说,这一个:
http://www.econ.yale.edu/~shiller/data/ie_data.xls
特别是该电子表格的第三张(前两张是图表).
我一直在使用该read_excel函数将 Excel 文件作为 Pandas 数据框导入,到目前为止没有明显问题。但是,我刚刚意识到在最近的一些更新之后,我收到了以下警告:
/usr/local/lib/python3.7/site-packages/xlrd/xlsx.py:266: PendingDeprecationWarning: 此方法将在未来版本中删除。使用 'tree.iter()' 或 'list(tree.iter())' 代替。
对于 self.tree.iter() 中的 elem if Element_has_iter else self.tree.getiterator(): /usr/local/lib/python3.7/site-packages/xlrd/xlsx.py:312: PendingDeprecationWarning: 此方法将是在以后的版本中删除。使用 'tree.iter()' 或 'list(tree.iter())' 代替。
对于elem in self.tree.iter() if Element_has_iter else self.tree.getiterator():
在互联网上搜索,似乎xlrd正在被 取代openpyxl。现在我的问题是:
tree.iter()或list(tree.iter())方法是什么?他们正在取代什么?我的环境是: