小编Aym*_*dji的帖子

python BeautifulSoup在div的子代中获取所有href

我是python的新手，我一直在尝试从此html代码获取链接和内部文本：

<div class="someclass">
  <ul class="listing">
        <li>
          <a href="http://link1.com" title="">title1</a>
                </li>
        <li>
           <a href="http://link2.com" title="">title2</a>
                 </li>
        <li>
           <a href="http://link3.com" title="">title3</a>
                 </li>
        <li>
           <a href="http://link4.com" title="">title4</a>
                  </li>
  </ul>
</div>

Run Code Online (Sandbox Code Playgroud)

我只想要来自href http://link.com和内部文字的所有链接title

我尝试了这段代码

    div = soup.find_all('ul',{'class':'listing'})
for li in div:
    all_li = li.find_all('li')
    for link in all_li.find_all('a'):
        print(link.get('href'))

Run Code Online (Sandbox Code Playgroud)

但是没有人能帮助我

python beautifulsoup

Aym*_*dji

2016 03-20

6
推荐指数

1
解决办法

4616
查看次数

python BeautifulSoup 获取特定元素

如果我有这样的 html 代码

<div class="new_info_next">
     <input type="hidden" value="133" id="new_id" class="new_id">
     <input type="hidden" value="0" id="default_pe" class="default_pe">
</div>

Run Code Online (Sandbox Code Playgroud)

我只想133在input第一行中使用 BeautifulSoup4 尝试此代码

info = soup.find_all("div", {"class": "new_info_next"})
for inpu in info:
    for inpu1 in inpu.select('input'):
         print inpu1 .get('value')

Run Code Online (Sandbox Code Playgroud)

但输出是

133
0

Run Code Online (Sandbox Code Playgroud)

如何获得只有 133

python beautifulsoup

Aym*_*dji

2017 08-19

4
推荐指数

2
解决办法

6794
查看次数

标签统计

beautifulsoup ×2

python ×2

python BeautifulSoup在div的子代中获取所有href

python BeautifulSoup 获取特定元素

标签 统计

小编Aym_dji的帖子

标签统计