使用openpyxl操作现有的Excel表

Hen*_*sen 3 python openpyxl

我目前正在磨练我的python / excel技能,并且遇到了openpyxl的问题

我试图打开一个工作簿,替换现有表中的行,然后再次保存该工作簿。

理想情况下,我还想先删除表格中的所有行(尽管保留表格结构)

我的初始工作簿包含一个名为“ inputData”的工作表。在这里,我有一个名为“数据”的表,其中A,B,C列和2行数据。

我也有一个名为“ input.csv”的csv文件,其中包含相同的列但4行数据。

当我运行代码时,数据被写入工作表中,但是表结构并未扩展为包含数据的两个新行。

关于如何使用openpyxl更改命名表结构的数据源的任何想法?

import csv
from openpyxl import load_workbook
from openpyxl.worksheet.table import Table, TableStyleInfo

wb = load_workbook(filename = 'workbook.xlsx')
ws = wb["inputData"]

with open('input.csv', newline='', encoding='utf-8-sig') as f:
    reader = csv.reader(f, delimiter=';')
    for i, row in enumerate(reader):
        if not i == 0:
            for j, cell in enumerate(row): 
                ws.cell(row=i+1, column=j+1).value = cell

wb.save('output.xlsx')
Run Code Online (Sandbox Code Playgroud)

链接到文件

Hen*_*sen 6

我想出了我问题的答案。

我可以从openpyxl访问表,更改ref(范围),然后再次将其保存。

这使我可以在同一表中输入更多数据,并使我的其他工作表上的公式考虑新数据。

当我需要在将来不破坏引用的情况下将大量数据推入现有的Excel工作表时,这将是一个非常有用的功能。

import csv
from openpyxl import load_workbook
from openpyxl.worksheet.table import Table, TableStyleInfo
tableName = 'Data'

style = TableStyleInfo(name="TableStyleMedium9", showFirstColumn=False,
                       showLastColumn=False, showRowStripes=True, showColumnStripes=False)

def colnum_string(n):
    string = ""
    while n > 0:
        n, remainder = divmod(n - 1, 26)
        string = chr(65 + remainder) + string
    return string

wb = load_workbook(filename = 'workbook.xlsx')
ws = wb["inputData"]

with open('input.csv', newline='', encoding='utf-8-sig') as f:
    reader = csv.reader(f, delimiter=';')
    for i, row in enumerate(reader):
        for j, cell in enumerate(row): 
            if not i == 0:
                ws.cell(row=i+1, column=j+1).value = float(cell)
            else:
                ws.cell(row=i+1, column=j+1).value = cell

            maxRef = [i,j]

for i, table in enumerate(ws._tables):
    if table.name == tableName:
        tableRef = i

resTable = Table(displayName="Data", ref="A1:{}{}".format(colnum_string(maxRef[0]), maxRef[1]))
resTable.tableStyleInfo = style

ws._tables[tableRef] = resTable

wb.save('output.xlsx')
Run Code Online (Sandbox Code Playgroud)

  • 谢谢亨利克·波尔森。很棒的代码!只是分享我自己的经验,以造福他人。确保您使用的是 openpyxl 库的 > v.2.4.4。在我升级之前,使用 [ws._tables] 访问“表集合”对我不起作用。 (3认同)
  • 干杯,与我遇到的问题完全一样,并且是一个很好的解决方案。 (2认同)

Var*_*rje 6

2020 年使用 openpyxl==3.0.5 偶然发现了这个问题,希望也可以为可能处于相同情况的其他人分享我的解决方案。

目标:从 data.csv 读取新数据并添加到现有 file.xlsx,因此公式仍然有效。列名称保持不变。

输入:

  1. XLSX 模板文件,其中一张纸上有公式,另一张纸上有数据 (file.xlsx)
  2. data.csv 包含新数据

输出:XLSX 文件,其中包含公式中使用的新数据和更新的表范围

"""python imports"""
import openpyxl
import pandas

"""Load input workbook"""
wb = openpyxl.load_workbook(filename='file.xlsx')

"""Activate worksheet named 'data'."""
ws = wb['data']

"""Read in new data from data1.csv to pandas.dataframe"""
new_dataframe = pandas.read_csv("data1.csv")

"""Iterate over dataframe rows and write values to worksheet"""
for i, row in new_dataframe.iterrows():
    # ws.append leaves first line empty
    # to get data written from first row,  need to use writing to cell
    if i == 0:
        for c, value in enumerate(row, start=1):
            ws.cell(row=2, column=c).value = value
    else:
        current_row = [row.col1, row.col2, row.col3]
        ws.append(current_row)

"""Change table range"""
ws.tables['MyTable'].ref = "A1:E5"

"""Save workbook"""
wb.save(filename='file.xlsx')
Run Code Online (Sandbox Code Playgroud)

伊森问题的答案:如何改变范围:

# Find right table
my_table = ws.tables['Template']
# Change range
my_table.ref = ref="A7:{}{}".format(column_string(maxRef[1], maxRef[0]))
# change style
my_table.tableStyleInfo = my_style
wb.save('WorkbookName')
Run Code Online (Sandbox Code Playgroud)