我想缩短并清理 CSV 文件以在 ElasticSearch 中使用它。但某些 Dataframe(单元格)中有换行符,无法将 CSV 解析为 ElasticSearch。我现在用 pandas 缩短了 CSV 并尝试删除换行符,但它不起作用。
代码如下:
import pandas as pd
f=pd.read_csv("test.csv")
keep_col = ["Plugin ID","CVE","CVSS","Risk","Host","Protocol","Port","Name","Synopsis","Description","Solution",]
new_f = f[keep_col].replace('\\n',' ', regex=True)
new_f.to_csv("newFile.csv", index=False)
Run Code Online (Sandbox Code Playgroud)
短缺正在发挥作用,但我在描述、概要和解决方案中添加了换行符。知道如何用 Python / Pandas 解决这个问题吗?CSV 有大约 100k 条目,因此必须在每个条目中删除换行符。
小智 5
据我所知, .replace() 参数的第三个参数获取您想要用新子字符串替换旧子字符串的次数,因此只需删除第三个参数,因为您不知道新行存在的次数。
new_f = f[keep_col].replace('\\n',' ')
Run Code Online (Sandbox Code Playgroud)
这应该有帮助