我们的CMS允许用户使用html编辑器输入文本,因此当在网页中阅读文本时,我可以这样发短信:

 <p>
 <strong>text text. more
text</strong>
 <a href="http://blabla>blabla</a> even more text...
Run Code Online (Sandbox Code Playgroud)
除了文本之外,我怎样才能删除所有内容.和类似的人物?
假设这是html(而不是xhtml),我会使用HTML Agility Pack来解析它,并访问InnerText:
static void Main()
{
HtmlDocument doc = new HtmlDocument();
doc.LoadHtml(@"
 <p>
 <strong>text text. more text</strong>
 <a href=""http://blabla>blabla</a> even more text...");
string s = doc.DocumentNode.InnerText;
// s is: 
 
 text text. more text

}
Run Code Online (Sandbox Code Playgroud)