从Div标签C#RegEx中提取内容

San*_*rst 2 html c# regex

我需要在divtestimonial1 div中提取这个内容我使用以下regEx,但它只返回第一行

Regex r = new Regex("&lt;div([^<]*<(?!/div>))");
Run Code Online (Sandbox Code Playgroud)
  <div class="testimonial_content" id="divtestimonial1">
          <a name="T1"></a>
          <div class="testimonial_headline">%testimonial1headline</div>
          <p align="left"><img src="" alt="" width="193" height="204" align="left" hspace="10" id="img_T1"/><span class="testimonial_text">%testimonial1text</span><br />
          </p>
  </div>

dri*_*iis 6

正则表达式通常不是解析HTML的好选择.您可能最好使用HTML Agility Pack等工具,因此我建议您使用它.

话虽这么说,您可以使用此正则表达式匹配您的特定样本输入:

<div.*?id="divtestimonial1".*?>.*</div>
Run Code Online (Sandbox Code Playgroud)

但它可能会破坏您的真实场景.正则表达式和HTML的一个问题是正确检测标签的嵌套等.