使用Python中的Openpyxl修改现有Excel文件

pau*_*suk 12 python csv openpyxl

我基本上试图从CSV文件中复制一些特定的列,并使用python将它们粘贴到现有的excel文件[*.xlsx]中.比如说,你有一个像这样的CSV文件:

 col_1   col_2   col_3  col_4
  1        2       3     4
  5        6       7     8
  9       10      11    12 
Run Code Online (Sandbox Code Playgroud)

所以,我想复制col_3和col_4,并将col_8和col_9中的那些粘贴到现有的excel文件[.XLSX格式]中.我已经用各种方式尝试解决这个问题,但是找不到确切的方法.我试过这样的事情:

with open( read_x_csv, 'rb') as f:
    reader = csv.reader(f)
    for row in reader: 
            list1 = row[13] 
            queue1.append(list1)
            list2 = row[14] 
            queue2.append(list2)
            list3 = row[15] 
            queue3.append(list3)
            list4 = row[16] 
            queue4.append(list4)
Run Code Online (Sandbox Code Playgroud)

然后

 rb = open_workbook("Exact file path.....")
 wb = copy(rb)
 ws = wb.get_sheet(0) 

 row_no = 0

 for item in queue1:
    if(item != ""):
            ii = int(item)
            ws.write(row_no,12,ii) 
            row_no = row_no + 1
            #ws.write(item)
            print item
    else:

            ws.write(row_no,12,item) 
            row_no = row_no + 1

  wb.save("Output.xls") 
Run Code Online (Sandbox Code Playgroud)

但是这个解决方案的问题是它不允许我保存为*.XLSX格式,这对我来说是严格要求的.

我曾尝试使用Openpyxl,因为它可以处理*.XLSX格式,但无法找到修改现有excel文件的方法.有人可以帮忙吗?

怀疑:1)我们真的可以从CSV文件读取整列并使用python存储到数组/列表中吗?2)我们可以使用openpyxl或任何其他软件包修改现有的.XLSX格式的excel文件吗?

Abh*_*jit 21

您可以尝试以下实现

from openpyxl import load_workbook
import csv
def update_xlsx(src, dest):
    #Open an xlsx for reading
    wb = load_workbook(filename = dest)
    #Get the current Active Sheet
    ws = wb.get_active_sheet()
    #You can also select a particular sheet
    #based on sheet name
    #ws = wb.get_sheet_by_name("Sheet1")
    #Open the csv file
    with open(src) as fin:
        #read the csv
        reader = csv.reader(fin)
        #enumerate the rows, so that you can
        #get the row index for the xlsx
        for index,row in enumerate(reader):
            #Assuming space separated,
            #Split the row to cells (column)
            row = row[0].split()
            #Access the particular cell and assign
            #the value from the csv row
            ws.cell(row=index,column=7).value = row[2]
            ws.cell(row=index,column=8).value = row[3]
    #save the csb file
    wb.save(dest)
Run Code Online (Sandbox Code Playgroud)
  • 我们真的可以从CSV文件中读取整列并使用python存储到数组/列表中吗?不,因为文件是按顺序读取的,所以csv reader无法将一列数据读取到一行.相反,您可以阅读整个内容并使用izip和islice来获取特定列.你也可以使用numpy.array

  • 我们可以使用openpyxl或任何其他包修改现有的.XLSX格式的excel文件吗?是的,请参阅上面的示例


Ima*_*ani 12

到了 2021 年,get_sheet_by_name已弃用并引发DeprecationWarning以下消息: Call to deprecated function get_sheet_by_name (Use wb[sheetname]).

可以使用以下代码片段以避免引发警告。

from openpyxl import load_workbook

file_path = 'test.xlsx'

wb = load_workbook(file_path)

ws = wb['SHEET_NAME']  # or wb.active

ws['G6'] = 123

wb.save(file_path)


Run Code Online (Sandbox Code Playgroud)