以下代码是我用来删除 ['text'] 列中的 \n 的当前代码:
df = pd.read_csv('file1.csv')
df['text'].replace('\s+', ' ', regex=True, inplace=True) # remove extra whitespace
df['text'].replace('\n',' ', regex=True) # remove \n in text
header = ["text", "word_length", "author"]
df_out = df.to_csv('sn_file1.csv', columns = header, sep=',', encoding='utf-8')
Run Code Online (Sandbox Code Playgroud)
我也从建议中尝试过:
df['text'].replace('\n', '')
df['text'] = df['text'].str.replace('\n', '').str.replace('\s+', ' ').str.strip()
Run Code Online (Sandbox Code Playgroud)
输出:'真是个聪明人!\n就像他对房地产交易一无所知一样......'
删除空格的代码正在运行。但不是在删除\n。任何人都可以帮助我解决这个问题吗?谢谢。
我试图根据此链接的建议解决太从熊猫数据帧单元格中凌乱的字符串中删除换行符?但它仍然无法正常工作。
解决了:
df['text'].replace(r'\s+|\\n', ' ', regex=True, inplace=True)
Run Code Online (Sandbox Code Playgroud)