如何使用c#从给定的HTML字符串中获取IMG标记的源代码

San*_*iya 2 c# regex asp.net

我从DB获取此HTML字符串: -

<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit, sed do eiusmod tempor incididunt ut labore et dolore magna aliqua. Ut enim ad minim veniam, quis nostrud exercitation ullamco laboris nisi ut aliquip ex</p><img class="classname" alt="alttext" src="http://www.domain.com/uploads/myimage.jpg" width="612" height="612" /><p>Going by the Itinerary, we will be at the official launch on the 22nd May.</p><img class="classname" alt="alttext" src="http://www.domain.com/uploads/myimage1.jpg" width="612" height="612" />
Run Code Online (Sandbox Code Playgroud)

正如您在字符串中看到的那样,有两个图像标记.我想得到第一个图像标签的来源,例如: -

http://www.domain.com/uploads/myimage.jpg
Run Code Online (Sandbox Code Playgroud)

任何人都可以建议我如何从HTML字符串中获取此文本.

提前致谢

I4V*_*I4V 13

你可以使用像HtmlAgilityPack这样的html解析器

string html = .......
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
doc.LoadHtml(html);
var link = doc.DocumentNode.SelectSingleNode("//img").Attributes["src"].Value;
Run Code Online (Sandbox Code Playgroud)

  • @dasheddot那么?我没有给出仅链接答案,而是发布了一个特定于OP案例的*working*代码. (2认同)