相关疑难解决方法(0)

需要使用RegEx和BeautifulSoup查找文本

我正在尝试解析一个网站以提取存储在正文中的一些数据,例如:

<body>
    <b>INFORMATION</b>
    Hookups: None
    Group Sites: No
    Station: No

    <b>Details</b>
    Ramp: Yes
</body>
Run Code Online (Sandbox Code Playgroud)

我想使用BeautifulSoup4和RegEx来提取Hookups和Group Sites等的值,但我对bs4和RegEx都不熟悉.我尝试了以下方法来获取Hookups值:

soup = BeautifulSoup(open('doc.html'))
hookups = soup.find_all(re.compile("Hookups:(.*)Group"))
Run Code Online (Sandbox Code Playgroud)

但搜索结果是空的.

python regex beautifulsoup web-scraping python-2.7

4
推荐指数
1
解决办法
1万
查看次数

标签 统计

beautifulsoup ×1

python ×1

python-2.7 ×1

regex ×1

web-scraping ×1