我是python的新手,我一直在尝试从此html代码获取链接和内部文本:
<div class="someclass">
<ul class="listing">
<li>
<a href="http://link1.com" title="">title1</a>
</li>
<li>
<a href="http://link2.com" title="">title2</a>
</li>
<li>
<a href="http://link3.com" title="">title3</a>
</li>
<li>
<a href="http://link4.com" title="">title4</a>
</li>
</ul>
</div>
Run Code Online (Sandbox Code Playgroud)
我只想要来自href http://link.com和内部文字的所有链接title
我尝试了这段代码
div = soup.find_all('ul',{'class':'listing'})
for li in div:
all_li = li.find_all('li')
for link in all_li.find_all('a'):
print(link.get('href'))
Run Code Online (Sandbox Code Playgroud)
但是没有人能帮助我
如果我有这样的 html 代码
<div class="new_info_next">
<input type="hidden" value="133" id="new_id" class="new_id">
<input type="hidden" value="0" id="default_pe" class="default_pe">
</div>
Run Code Online (Sandbox Code Playgroud)
我只想133在input第一行中使用 BeautifulSoup4 尝试此代码
info = soup.find_all("div", {"class": "new_info_next"})
for inpu in info:
for inpu1 in inpu.select('input'):
print inpu1 .get('value')
Run Code Online (Sandbox Code Playgroud)
但输出是
133
0
Run Code Online (Sandbox Code Playgroud)
如何获得只有 133