use*_*948 5 javascript python parsing web-crawler web-scraping
我正在开展一个项目,我需要抓取几个网站并从中收集不同类型的信息.文本,链接,图像等信息
我正在使用Python.我在HTML页面上为此目的尝试了BeautifulSoup并且它可以工作,但是在解析包含大量JavaScript的网站时我很困难,因为这些文件的大部分信息都存储在<script>标记中.
任何想法如何做到这一点?
| 归档时间: |
|
| 查看次数: |
9700 次 |
| 最近记录: |