小编Lil*_*ily的帖子

在pandas python中删除文本中的'\n'

以下代码是我用来删除 ['text'] 列中的 \n 的当前代码:

df = pd.read_csv('file1.csv')

df['text'].replace('\s+', ' ', regex=True, inplace=True) # remove extra whitespace
df['text'].replace('\n',' ', regex=True) # remove \n in text

header = ["text", "word_length", "author"]

df_out = df.to_csv('sn_file1.csv', columns = header, sep=',', encoding='utf-8')
Run Code Online (Sandbox Code Playgroud)

我也从建议中尝试过:

df['text'].replace('\n', '')
df['text'] = df['text'].str.replace('\n', '').str.replace('\s+', ' ').str.strip()
Run Code Online (Sandbox Code Playgroud)

输出:'真是个聪明人!\n就像他对房地产交易一无所知一样......'

删除空格的代码正在运行。但不是在删除\n。任何人都可以帮助我解决这个问题吗?谢谢。

我试图根据此链接的建议解决太从熊猫数据帧单元格中凌乱的字符串中删除换行符?但它仍然无法正常工作。

解决了:

df['text'].replace(r'\s+|\\n', ' ', regex=True, inplace=True) 
Run Code Online (Sandbox Code Playgroud)

python regex string python-2.7 pandas

5
推荐指数
1
解决办法
8288
查看次数

标签 统计

pandas ×1

python ×1

python-2.7 ×1

regex ×1

string ×1