Python脚本检查网站的标签

Lin*_*nut 1 html python linux scripting crontab

我试图找出如何去写一个网站监控脚本(到底cron作业)开辟一个给定的URL,检查是否标签存在,如果该标签不存在,或者不包含预期的数据,然后将一些数据写入日志文件,或发送电子邮件.

标签会是类似的或类似的东西.

有人有主意吗?

Bar*_*tek 5

你最好的选择是看看BeautifulSoup.像这样的东西:

import urllib2
from BeautifulSoup import BeautifulSoup

page = urllib2.urlopen("http://yoursite.com")
soup = BeautifulSoup(page)

# See the docs on how to search through the soup. I'm not sure what
# you're looking for so my example stops here :)
Run Code Online (Sandbox Code Playgroud)

之后,通过电子邮件发送或登录它是非常标准的票价.