sna*_*ack 3 python string pandas
我正在清理一些文本数据,但无法找到包含某些字符串的行。如果我做一个简单的布尔值,我会得到:
'<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^' in articles.loc[25111, 'content']
True
Run Code Online (Sandbox Code Playgroud)
但是,如果我选择具有完全相同字符串的行,则会得到一个空数据框:
articles[articles['content'].str.contains('<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^')]
id title author date content year month publication category digital section url stems
Run Code Online (Sandbox Code Playgroud)
为什么会发生这种情况?
我认为某些值被读取为正则表达式,因此需要regex=False在str.contains.
s = '<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^'
articles[articles['content'].str.contains(s, regex=False)]
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
1127 次 |
| 最近记录: |