我正在使用C#,我想以编程方式下载一个完整的网页......我的意思是不仅仅是页面源
我希望网页下载与FireFox中的"save page as"相同,但我想这样做编程?
Ode*_*ded 10
您需要下载并解析页面以查找所有外部资源,然后依次下载(并可能解析它并下载其中的资源).
为解析HTML,我建议使用HTML Agility Pack.您需要记住要下载的资源(图像,css,javascript等)并查询页面.
您需要记住,某些页面将定义一个base,您需要考虑该页面以及具有相对和绝对链接的页面URL.
您可能还想解析CSS以获取图像引用等内容.
要完成,您需要将所有这些引用更改为指向资源下载位置的本地引用(感谢@Scott M).
| 归档时间: |
|
| 查看次数: |
2987 次 |
| 最近记录: |