除了html中的文本之外的所有内容

Kar*_*ten 4 html c# string

我们的CMS允许用户使用html编辑器输入文本,因此当在网页中阅读文本时,我可以这样发短信:

&#xD;&#xA;      <p>&#xD;&#xA;      <strong>text text. more 
text</strong>&#xD;&#xA;      <a href="http://blabla>blabla</a> even more text...
Run Code Online (Sandbox Code Playgroud)

除了文本之外,我怎样才能删除所有内容.和类似的人物?

Mar*_*ell 6

假设这是html(而不是xhtml),我会使用HTML Agility Pack来解析它,并访问InnerText:

static void Main()
{
    HtmlDocument doc = new HtmlDocument();
    doc.LoadHtml(@"&#xD;&#xA;      <p>&#xD;&#xA;      <strong>text text. more text</strong>&#xD;&#xA;      <a href=""http://blabla>blabla</a> even more text...");
    string s = doc.DocumentNode.InnerText;
    // s is: &#xD;&#xA;      &#xD;&#xA;      text text. more text&#xD;&#xA;     
}
Run Code Online (Sandbox Code Playgroud)