什么正则表达式将嵌套表与表格单元格中的可识别文本匹配?

Jay*_*son 1 regex html-parsing

什么正则表达式将嵌套表与表格单元格中的可识别文本匹配?我已经尝试但未能提出一个正则表达式来提取我想要的特定表,而不是抓住示例中两个表的开头和结尾.这是一些入门:" <table>.*?</table>"

<table>
    <tr>
        <td>
            <table>
                <tr><td>Code1</td></tr>
                <tr><td>some data</td></tr>
                <tr><td>etc ...</td></tr>
            </table>
        </td>
    </tr>
    <tr>
        <td>
            <table>
                <tr><td>Code2</td></tr>
                <tr><td>some data</td></tr>
                <tr><td>etc ...</td></tr>
            </table>
        </td>
    </tr>
</table>
Run Code Online (Sandbox Code Playgroud)

假设我想提取包含"Code2"的表.什么正则表达式将具体匹配,只有那个表?

Bri*_*new 6

我不会在这方面使用正则表达式,因为HTML不是常规的,并且没有结束边缘情况的绊倒你.你最好使用HTML解析器.无论您使用哪种语言或平台,都可以使用.