我正在解析一个html页面,让我们说这个页面列出了一个足球队的所有球员,那些老年人将会加粗.我无法逐行解析文件并查找强标记,因为在我的实例中,模式更加复杂并且跨越多行.
像这样的东西:
<strong>Senior:</strong> John Smith
Junior: Joe Smith
<strong>Senior:</strong> Mike Johnson
Run Code Online (Sandbox Code Playgroud)
等等.如何编写perl正则表达式来获取所有老年人的名字?
谢谢
你在编写正则表达式时遇到困难的原因是因为这是工作的错误工具.您应该使用HTML :: Parser,HTML :: TokeParser或HTML :: TreeBuilder等真正的HTML解析器.
我不能举一个具体的例子,因为我怀疑这正是你的HTML的样子.您的示例似乎缺少一些标点符号或其他标记.