-1
python
web-crawler
data-mining
问题:在Uni找到数学讲座的答案和练习.赫尔辛基
实际问题
- 使用
Disallowrobots.txt中的.com制作网站列表
- 在(1)处创建包含*.pdf文件的站点列表
- 在(2)中制作一个包含pdf文件中"analyysi"一词的网站列表
对实际问题的建议
- 问题3:制作一个从pdf文件中删除数据的编译器
问题
- 你如何搜索注册的.com-网站?
- 您如何通过Python的defaultdict和BeautifulSoap解决实际问题1和2?