ale*_*cxe 12 html python beautifulsoup html-parsing
在BeautifulSoup,.text和之间有什么区别.get_text()吗?
获取元素的文本应该首选哪一个?
>>> from bs4 import BeautifulSoup
>>>
>>> html = "<div>text1 <span>text2</span><div>"
>>> soup = BeautifulSoup(html, "html.parser")
>>> div = soup.div
>>> div.text
'text1 text2'
>>> div.get_text()
'text1 text2'
Run Code Online (Sandbox Code Playgroud)
mgi*_*son 20
看起来它.text只是一个叫做的财产get_text.因此,get_text不带参数的调用与之相同.text.然而,get_text也可以支持各种关键字参数来改变它的行为(separator,strip,types).如果您需要更多控制结果,那么您需要功能表单.