我在和雅虎搞砸了!管道,我正在用一些正则表达式撞墙.现在我熟悉Perl的正则表达式,但雅虎的规则似乎有所不同!管道.
我正在做的是获取一个页面并尝试将其转换为一个feed,我从HTML中删除链接的正则表达式工作正常,但我希望成为<i>标签中的标题只输出原始文本.
在Perl和此在线regexp测试器中匹配的示例文本:
<a rel="nofollow" target="_blank" HREF="http://changed.to/protect/the-guilty.html"> <i>"费用乐趣"(英文男士)</ i> </a>(另请参阅此其他网站<a rel="nofollow" target="_blank" href="http://stackoverflow.com"> Nada </a>)此处的其他一些文字
RegEx的标题:
(?i).*?<i>([^<]*).* [ ] g [x] s [ ] m [ ] i
Run Code Online (Sandbox Code Playgroud)
RegEx的链接:
(?i).*?href="([^"]*).* [ ] g [x] s [ ] m [ ] i
Run Code Online (Sandbox Code Playgroud)
不知何故,不区分大小写的复选框似乎被打破了.幸运的是,你可以替代(?i),这很好地工作.
这是一个很好的web2.0-ish工具,用于测试正则表达式:RegExr.但由于某种原因,它仍然是测试版.;-)