您无法使用正则表达式有用地解析HTML.如果您事先知道页面的格式 - 例如.
那么你可以侥幸逃脱它,但对于一般[X] HTML,正则表达式解析器是不合适的.
根据您使用的语言,您需要找到HTML解析器库(例如Python的BeautifulSoup),或者结合标准XML解析器的HTML整理器,然后扫描文档中的<a>元素(也许其他的,例如.<img>如果你对这些感兴趣吗?),那么将属性值拆分为'?'.
| 归档时间: |
|
| 查看次数: |
3159 次 |
| 最近记录: |