'str.contains' 不返回数据帧中的值

sna*_*ack 3 python string pandas

我正在清理一些文本数据,但无法找到包含某些字符串的行。如果我做一个简单的布尔值,我会得到:

'<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^' in articles.loc[25111, 'content']

True
Run Code Online (Sandbox Code Playgroud)

但是,如果我选择具有完全相同字符串的行,则会得到一个空数据框:

articles[articles['content'].str.contains('<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^')]

id  title   author  date    content year    month   publication category    digital section url stems
Run Code Online (Sandbox Code Playgroud)

为什么会发生这种情况?

jez*_*ael 6

我认为某些值被读取为正则表达式,因此需要regex=Falsestr.contains.

s = '<! [CDATA[! function( d,s, id){varjs, fjs=d. getElementsByTagName( s)[0],p= ^'
articles[articles['content'].str.contains(s, regex=False)]
Run Code Online (Sandbox Code Playgroud)