car*_*arl 7 html python beautifulsoup
我有一个类似的文字
page.content = <body><b>Title:</b> Test title</body>
Run Code Online (Sandbox Code Playgroud)
我可以获得Title标签
soup = BeautifulSoup(page.content)
record_el = soup('body')[0]
b_el = record_el.find('b',text='Title:')
Run Code Online (Sandbox Code Playgroud)
但我如何获得b标签后的文字?我想通过引用该元素而不是body元素来获取包含"Title:"的元素之后的文本.
Hub*_*iak 13
参考的文档,你可能想使用next_sibling你的b_el:
b_el.next_sibling # contains " Test title"
Run Code Online (Sandbox Code Playgroud)
此上下文中的"兄弟姐妹"是下一个节点,而不是下一个元素/标签.元素的下一个节点是文本节点,因此您可以获得所需的文本.