定期表达以匹配不在href中的单词

Und*_*ned 0 php regex html-parsing

可能重复:
RegEx匹配除XHTML自包含标记之外的开放标记

可以说我正在尝试在字符串中匹配单词"google",但有时该字符串包含一个链接,(<a href="http://www.google.com">google</a>)但我只想匹配,如果它不是链接.

如何检查<a href="http://www.google.com">单词之前是否有?

And*_*ter 7

最准确的方法是:

  • 将字符串解析为HTML
  • 搜索任何不是字符串"Google"的标记.

您不想尝试使用正则表达式解析HTML.从长远来看,它会让你伤心.请查看http://htmlparsing.com/以获取可以帮助您入门的一些指示.

  • @Undefined现在有人正在研究一个正在使用你的特定测试用例的正则表达式,但是当你尝试在现实世界中应用它时会因各种原因而失败.这个答案是一个更好的方法. (2认同)