.text和.get_text()之间的差异

ale*_*cxe 12 html python beautifulsoup html-parsing

BeautifulSoup,.text和之间有什么区别.get_text()吗?

获取元素的文本应该首选哪一个?

>>> from bs4 import BeautifulSoup
>>>
>>> html = "<div>text1 <span>text2</span><div>"
>>> soup = BeautifulSoup(html, "html.parser")
>>> div = soup.div
>>> div.text
'text1 text2'
>>> div.get_text()
'text1 text2'
Run Code Online (Sandbox Code Playgroud)

mgi*_*son 20

看起来它.text只是一个叫做的财产get_text.因此,get_text不带参数的调用与之相同.text.然而,get_text也可以支持各种关键字参数来改变它的行为(separator,strip,types).如果您需要更多控制结果,那么您需要功能表单.