如何解析HTML/XML并从中提取信息?
我需要匹配所有这些开始标记:
<p>
<a href="foo">
Run Code Online (Sandbox Code Playgroud)
但不是这些:
<br />
<hr class="foo" />
Run Code Online (Sandbox Code Playgroud)
我想出了这个,并希望确保我做对了.我只抓住了a-z.
<([a-z]+) *[^/]*?>
Run Code Online (Sandbox Code Playgroud)
我相信它说:
/,然后我有这个权利吗?更重要的是,你怎么看?
我见过很多表达式来删除特定的标签(或多个指定标签),以及一个以删除所有,但一个特定的标签,但我还没有找到一种方法,除了许多排除(即所有除了全部删除p, b, i, u, a, ul, ol, li)在PHP.我对正则表达式很不满意,所以我需要一只手.:) 谢谢!