使用网络浏览器(IE 或 Chrome),我可以使用 Ctl-S 保存网页 (.html),使用任何文本编辑器检查它,并以表格格式查看数据。我想提取其中一个数字,但对于很多很多网页来说,手动操作太多了。所以我想使用 WGET 一个接一个地获取这些网页,并编写另一个程序来解析 .html 并检索我想要的数字。但是WGET在使用与浏览器相同的URL时保存的.html文件不包含数据表。为什么不?就好像服务器检测到请求来自 WGET 而不是来自 Web 浏览器,并提供一个缺少数据表的骨架网页。如何使用 WGET 获得完全相同的网页?- 谢谢!
更多信息:
我试图获取的 URL 示例是: http://performance.morningstar.com/fund/performance-return.action?t=ICENX®ion=usa&culture=en-US 其中字符串 ICENX 是共同基金股票代码,我将更改为许多不同的股票代码中的任何一个。在浏览器中查看时,这会下载数据表,但如果使用 WGET 获取数据表,则会丢失数据表。
wget ×1