现在我知道在读取 csv 文件时修改它通常是不可行的,因此您需要创建一个新的 csv 文件并写入其中。我遇到的问题是保留数据的原始顺序。
输入的 csv 文件如下所示:
C1 C2 C3
apple BANANA Mango
pear PineApple StRaWbeRRy
Run Code Online (Sandbox Code Playgroud)
我想将所有数据转换为小写并输出一个新的 csv 文件,如下所示:
C1 C2 C3
apple banana mango
pear pineapple strawberry
Run Code Online (Sandbox Code Playgroud)
到目前为止,我可以遍历输入的 csv 文件并将所有值转换为小写,但我不知道如何将其重写为该格式的 csv 文件。我的代码是:
def clean (input)
aList = []
file = open(input, "r")
reader = csv.reader(file, delimiter = ',')
next(reader, None) # Skip the header but I want to preserve it in the output csv file
for row in reader:
for col in row:
aList.append(col.lower())
Run Code Online (Sandbox Code Playgroud)
所以现在我有一个包含所有小写数据的列表,我如何将它重写回与输入相同格式(相同行数和列数)的 csv 文件,包括我在代码中跳过的标题行。
熊猫方式:
使用pandas读取文件并获取数据帧。然后你可以简单地使用lower()
import pandas as pd
def conversion(text):
return text.lower()
df = pd.read_csv(file_path)
df[column_name] = df[column_name].map(conversion)
Run Code Online (Sandbox Code Playgroud)
甚至是单个班轮:
df[column_name] = df[column_name].apply(lambda x: x.lower()) # If you have nan or other non-string values, you may need to convert x to string first like str(x).lower()
Run Code Online (Sandbox Code Playgroud)
然后你可以使用to_csv函数保存它
| 归档时间: |
|
| 查看次数: |
31761 次 |
| 最近记录: |