如何使用RegExp从嵌套的类HTML元素中检索值集合?

1 html regex parsing

我在为以下任务创建正则表达式时遇到问题:

假设我们有类似HTML的文本:

<x>...<y>a</y>...<y>b</y>...</x>
Run Code Online (Sandbox Code Playgroud)

我想<y></y>在给定<x>标签内的标签内获得一组值,因此上面示例的结果将是两个元素["a","b"]的集合.

此外,我们知道:

  • <y>标签不能包含在其他<y>标签中
  • ... 可以包含任何文本或其他标签.

如何使用RegExp实现这一目标?

Bil*_*ard 9

这是HTML/XML解析器的工作.你可以用正则表达式来做,但它会非常混乱.我链接到的页面中有一些示例.