Python Beautifulsoup获取属性值

Win*_*981 2 python beautifulsoup

我在使用HTML 5.0获取在Beautifulsoup中提取属性值的正确语法时遇到困难。

因此,在出现soupHTML 5问题的情况下,我使用正确的语法隔离了标签中的出现:

tags = soup.find_all(attrs={"data-topic":"recUpgrade"})
Run Code Online (Sandbox Code Playgroud)

只取标签[1]:

date = tags[1].find(attrs={"data-datenews":True})
Run Code Online (Sandbox Code Playgroud)

日期是:

<span class="invisible" data-datenews="2018-05-25 06:02:19" data-idnews="2736625" id="horaCompleta"></span>
Run Code Online (Sandbox Code Playgroud)

但是现在我想提取日期时间为“ 2018-05-25 06:02:19”。无法获取语法。

请提供见解/帮助。

Rak*_*esh 6

您可以使用键值对访问attrs

例如:

from bs4 import BeautifulSoup
s = """<span class="invisible" data-datenews="2018-05-25 06:02:19" data-idnews="2736625" id="horaCompleta"></span>"""
soup = BeautifulSoup(s, "html.parser")
print(soup.span["data-datenews"])
Run Code Online (Sandbox Code Playgroud)

输出:

2018-05-25 06:02:19
Run Code Online (Sandbox Code Playgroud)