jam*_*ieb 9 python parsing beautifulsoup
我有一个看起来像这样的页面:
Company A<br />
123 Main St.<br />
Suite 101<br />
Someplace, NY 1234<br />
<br />
<br />
<br />
Company B<br />
456 Main St.<br />
Someplace, NY 1234<br />
<br />
<br />
<br />
Run Code Online (Sandbox Code Playgroud)
有时分隔条目有两个而不是三个"br"标签.我如何使用BeautifulSoup解析此文档并提取字段?我很难过,因为我需要的文本位不包含在我可以简单地遍历的段落(或类似)标签中.
| 归档时间: |
|
| 查看次数: |
6119 次 |
| 最近记录: |