dra*_*mnl 1 html python beautifulsoup html-parsing
我需要从链接(a)标签中取"href"属性.
我跑
label_tag = row.find(class_='Label')
print(label_tag)
Run Code Online (Sandbox Code Playgroud)
我得到了(抱歉,出于隐私原因,我无法显示链接和文字)
<a class="Label" href="_link_">_text_</a>
Run Code Online (Sandbox Code Playgroud)
的类型
<class 'bs4.element.Tag'>
Run Code Online (Sandbox Code Playgroud)
但是当我跑步时(如BeautifulSoup所示,获得href)
tag_link = label_tag['href']
print(tag_link)
Run Code Online (Sandbox Code Playgroud)
我想以下错误(在第一个命令上)
TypeError: 'NoneType' object is not subscriptable
Run Code Online (Sandbox Code Playgroud)
任何线索?提前致谢
[已解决]编辑:我犯了一个错误(循环使用异构结构的元素)
我的猜测是,label_tag实际上并没有返回你正在寻找的汤的一部分.这个最小的例子有效:
import bs4
text = '''<a class="Label" href="_link_">_text_</a>'''
soup = bs4.BeautifulSoup(text)
link = soup.find("a",{"class":"Label"})
print (link["href"])
Run Code Online (Sandbox Code Playgroud)
输出:
_link_
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
5079 次 |
| 最近记录: |