使用C#解析Html中的完整字符串

Question

使用C#解析Html中的完整字符串

我有以下两个html-的例子

<a href="http://foo.com">User</a>: <a style="color:#333" href="http://foo.com/word"></a> blue elephant  &middot;

<a href="http://foo.com">User</a>: <a style="color:#333" href="http://foo.com/word">@<b>word</b></a> blue elephant  &middot;

Run Code Online (Sandbox Code Playgroud)

我正在尝试使用C#解析它以放入csv文件并且它在某种程度上工作,但是当html中包含"@"符号时,它将使csv单元格保持空白或者不包含单词" @'之前.我试图得到的主要部分@word blue elephant是带回一个空白单元格,而第一个html示例则blue elephant根据需要返回.

我使用以下技术来做到这一点 -

string[] comm = System.Text.RegularExpressions.Regex.Split(content[1], "<a");

Run Code Online (Sandbox Code Playgroud)

我如何改变它以适用于第二个html示例？

Answer 1

Rus*_*Cam 6

在这种情况下,你想使用像HTML敏捷包中那样的HTML解析器(并避免调用Cthulhu的愤怒)

一些如何使用它的例子

归档时间：	14 年，4 月前
查看次数：	1546 次
最近记录：	8 年，3 月前