C#中的regexp解析错误

tak*_*shi 0 .net c# regex

我有包含此类文本的html

.......
<a class="product_name" href="index.php?productID=29785">Funny</a>
........
<a class="product_name" href="index.php?productID=29787">Very Funny</a>
......
Run Code Online (Sandbox Code Playgroud)

我想将属性值和文本href到链接中,所以我想得到

"index.php?productID=29785", "Funny"
"index.php?productID=29787", "Very Funny"
Run Code Online (Sandbox Code Playgroud)

而我用

MatchCollection mc = Regex.Matches(pageData, 
   "<a class=\"product_name\" href=\"(.+)\">(.+)</a>");
Run Code Online (Sandbox Code Playgroud)

为了这.但是当我调试代码时,我看到mc.Count = 0

我想我没有正确地逃脱报价,但我不知道.

Ode*_*ded 5

不要使用正则表达式解析HTML.请看这里有一个令人信服的理由.

请改用HTML Agility Pack.