小编Hyu*_*yun的帖子

urllib中的http://www.ssa.gov/cgi-bin/popularnames.cgi的(可能是基本的)网络抓取

我是Python(和网络抓取)的新手.让我问你一个问题.

许多网站实际上并未在Firefox或其他浏览器中报告其特定URL.例如,社会安全管理员显示具有等级的流行婴儿名字(自1880年以来),但当我将年份从1880年改为1881年时,网址不会改变.它是不断的,

http://www.ssa.gov/cgi-bin/popularnames.cgi

因为我不知道具体的URL,所以我无法使用urllib下载网页.

在此页面源中,它包括:

<input type="text" name="year" id="yob" size="4" value="1880">

所以,假设我可以控制这个"年"值(比如"1881"或"1991"),我可以解决这个问题.我对吗?我还是不知道怎么做.

有人可以告诉我解决方案吗?

如果您了解一些可能有助于我学习的网站,请告知我们.

谢谢!

python firebug cgi urllib web-scraping

6
推荐指数
1
解决办法
1355
查看次数

标签 统计

cgi ×1

firebug ×1

python ×1

urllib ×1

web-scraping ×1