正则表达式从IMG标签中找到src

Wah*_*eed 2 c# regex asp.net

我有一个网页.从那里我想找到所有IMG标签并获得那些IMG标签的SRC.

这样做的正则表达式是什么.

一些解释:

我正在抓一个网页.除图像外,所有数据都正确显示.要解决这个问题,哇我有一个想法,找到SRC并替换它:例如

/images/header.jpg
Run Code Online (Sandbox Code Playgroud)

并替换它

www.stackoverflow/images/header.jpg
Run Code Online (Sandbox Code Playgroud)

Pao*_*ino 12

你不想要一个正则表达式,你想要一个解析器.从这个问题:

class Program
{
    static void Main(string[] args)
    {
        var web = new HtmlWeb();
        var doc = web.Load("http://www.stackoverflow.com");

        var nodes = doc.DocumentNode.SelectNodes("//img[@src]");

        foreach (var node in nodes)
        {
                Console.WriteLine(node.src);
        }
    }
}
Run Code Online (Sandbox Code Playgroud)

  • 哇,这是'Pa [ou] lo's的战斗:-) (8认同)
  • 他仍然可以将它加载到解析器中,如果它来自用户,则更是如此.已经讨论了为什么正则表达式解析HTML的坏主意. (2认同)