我正在研究无上下文语法,我很好奇带有星形的箭头和没有星形的箭头在f和g部分中的含义:

如何仅从与类匹配的定位标记中的href中获取文本。所以如果我有
<a href="Link_I_Need.html" class="Unique_Class_Name">link text</a>
Run Code Online (Sandbox Code Playgroud)
如何仅从带有类Unique_Class_Name的锚标记中获取字符串Link_I_Need.html?
这就是我的HTML看起来我正在解析的方式.它都在一个表中,并且重复多次,我只想要hrefdiv中带有属性的属性值class="Special_Div_Name".然后所有这些div都在表行内,并且有很多行.
<tr>
<div class="Special_Div_Name">
<a href="something.mp3">text</a>
</div>
</tr>
Run Code Online (Sandbox Code Playgroud)
我想要的只是href以".mp3"结尾的属性值,它们在带有属性的div中class="Special_Div_Name".
到目前为止,我能够提出这个代码:
download = soup.find_all('a', href = re.compile('.mp3'))
for text in download:
hrefText = (text['href'])
print hrefText
Run Code Online (Sandbox Code Playgroud)
此代码当前打印出href以".mp3"结尾的页面上的每个属性值,并且非常接近于完全按照我的意愿行事.它只是我只想要div类中的".mp3".