使用perl匹配页面上未知的出现次数?

Cha*_*lie 1 perl html-parsing

我正在解析一个html页面,让我们说这个页面列出了一个足球队的所有球员,那些老年人将会加粗.我无法逐行解析文件并查找强标记,因为在我的实例中,模式更加复杂并且跨越多行.

像这样的东西:

<strong>Senior:</strong> John Smith
Junior: Joe Smith
<strong>Senior:</strong> Mike Johnson
Run Code Online (Sandbox Code Playgroud)

等等.如何编写perl正则表达式来获取所有老年人的名字?

谢谢

cjm*_*cjm 6

你在编写正则表达式时遇到困难的原因是因为这是工作的错误工具.您应该使用HTML :: Parser,HTML :: TokeParserHTML :: TreeBuilder等真正的HTML解析器.

我不能举一个具体的例子,因为我怀疑这正是你的HTML的样子.您的示例似乎缺少一些标点符号或其他标记.