小编Ham*_*ama的帖子

Beautifulsoup - 如何获取具有特定类的块内的所有链接?

我有以下 HTML Dom:

    <div class="meta-info meta-info-wide"> <div class="title">???????????</div> <div class="content contains-text-link"> 

<a class="dev-link" href="http://www.jourist.com&amp;sa=D&amp;usg=AFQjCNHiC-nLYHAJwNnvDyYhyoeB6n8YKg" rel="nofollow" target="_blank">??????? ?? ???-????</a>

 <a class="dev-link" href="mailto:info@jourist.com" rel="nofollow" target="_blank">????????: info@jourist.com</a> 

 <div class="content physical-address">Diagonalstraße 41
    20537 Hamburg</div> </div> </div>
Run Code Online (Sandbox Code Playgroud)

我需要使用dev-linkblock 内的类获取所有链接(url)div.meta-info-wide

我尝试了这种明显的方式,但不起作用:

divTag = soup.find_all("div", {"class":"meta-info-wide"})
        print(len(divTag))

        for tag in divTag:
            tdTags = tag.find_all("a", {"class":"dev-link"})
            for tag in tdTags:
                print tag.text
Run Code Online (Sandbox Code Playgroud)

python beautifulsoup python-2.7

5
推荐指数
1
解决办法
4706
查看次数

如何在Python中加速Beautifulsoup?

我尝试使用Python中的Beautifulsoup解析50 000个url.解析在循环中工作:

我发现解析一个页面的时间是15-18秒.从第一页开始,我会抓住20个元素.

为什么Beautifulsoup工作这么慢?如何在Python中加速Beautifulsoup?

python beautifulsoup python-2.7

-1
推荐指数
1
解决办法
179
查看次数

标签 统计

beautifulsoup ×2

python ×2

python-2.7 ×2