从网页抓取文本

vin*_*456 3 c python webpage text

我想写一个程序,找到公共汽车站的时间并相应地更新我的个人网页.

如果我手动这样做,我会的

  1. 访问www.calgarytransit.com
  2. 输入一个停止号码.即)9510
  3. 点击"下一班巴士"按钮

结果可能如下所示:

10:16p Route 154
10:46p Route 154
11:32p Route 154

一旦我抓住了时间和路线,我就会相应地更新我的网页.

我不知道从哪里开始.我知道他们对网络编程很沮丧,但可以编写一些C和Python.我可以研究哪些主题/库?

小智 13

Beautiful Soup是一个用于解析网页的Python库.在它和urllib2之间(Python 3中的urllib.request)你应该能够弄清楚你需要什么.


Cha*_*tin 5

您所询问的内容称为"网页抓取".我敢肯定,如果你在谷歌周围找到一些东西,但核心概念是你想打开一个网站的连接,在HTML中啜饮,解析它并识别你想要的块.

Python的维基有一个很好的很多东西.