正则表达式在HTML中获取特定TD内部的值

mrb*_*lah 1 c# regex

我需要在HTML中获取具有以下模式的特定元素:(C#)

<td class="blah" ...........>Some text blah: page x of xx<br>
Run Code Online (Sandbox Code Playgroud)

我需要得到xx的值.

在上述模式中唯一不变的是:

  1. 它是一个TD元素
  2. 它有class ="blah"
  3. 它有文本模式":xx的第x页

您可以假设上述模式只有1次出现.

jve*_*ema 7

请不要使用正则表达式来解析HTML!

获取HTML敏捷包的副本,您的生活将变得更加简单,您的应用程序也不那么脆弱.