如何使用python抓取网站/将数据提取到数据库中？

Question

我想构建一个webapp来帮助我大学的其他学生创建他们的日程安排.为此,我需要抓取主时间表(一个巨大的html页面)以及每个课程的详细描述链接到数据库中,最好是在python中.另外,我需要登录才能访问数据.

Answer 1

requests 用于下载页面.
- 以下是如何登录网站和下载页面的示例:https://stackoverflow.com/a/8316989/311220
lxml 用于抓取数据.

如果你想使用强大的抓取框架Scrapy.它也有一些很好的文档.根据你的任务,这可能有点矫枉过正.