用于保存整个网页的C#代码?(带图像/格式)

Gre*_*reg 4 c# http

我一直在努力寻找一些C#代码(我正在使用C#Visual Studio 2008 Express)的例子,它可以以编程方式保存整个网页(给定URL),包括图像和格式(例如CSS).目的是在随后的阶段我将其发送出去(不确定如何),以便稍后通过浏览器查看.

是否有一个最简单的方法(利用.NET Framework方法)来保存整个网页?保存为具有图像子目录的一个页面或其他.当您说"保存整个网页"时,基本上与浏览器相同.

Ash*_*Ash 6

最简单的方法可能是将WebBrowser控件添加到应用程序中,并使用该Navigate()方法将其指向要保存的页面.

然后,当文档加载时,调用ShowSaveAsDialog方法.然后,用户可以将页面保存为单个文件,或将图像保存在子目录中.

[更新]

现在已经在你的问题中"以编程方式"注意到,上述方法并不理想,因为它需要用户参与或深入研究Windows API以使用SendKeys或类似方式发送输入.

.NET Framework中没有任何内置功能可以满足您的所有需求.

所以我修改的方法是:

  • 用于System.NET.HttpWebRequest将主HTML文档作为字符串或流(简单).
  • 将其加载到HTMLAgilityPack文档中,您现在可以在其中轻松查询文档以获取所有图像元素,样式表链接等的列表.
  • 然后为每个文件发出单独的Web请求,并将它们保存到子目录中.
  • 最后更新主页面中的所有相关链接以指向子目录中的项目.

实际上,您将实现一个非常简单的Web浏览器.您可能会遇到使用JavaScript动态更改或请求页面内容的页面的问题,但对于大多数页面,这应该给出可接受的结果.


Tzu*_*hay 1

来自代码项目:ZetaWebSpider