TIM*_*MEX 6 html python string parsing templates
假设我下载了HTML代码,我可以解析它.如果该网站没有元描述标签,我如何获得该网站的"最佳"描述?
loe*_*org 1
为了跟进上面的“可读性”建议(其本身受到 InstaPaper 网站的启发),他们发布了 JavaScript: http: //code.google.com/p/arc90labs-readability/。更重要的是,有人把它移植到了 python 上: http: //github.com/gfxmonk/python-readability。麾!
归档时间:
15 年,10 月 前
查看次数:
509 次
最近记录: