Python相当于Javascript的jQuery或Node的cheerio?

com*_*ted 6 python api jquery node.js cheerio

我正在寻找一个与jQuery或Cheerio具有类似API和用法的库.

我的用例是:解析包含javascript/css文件引用的任何脚本或链接标记的HTML文件.

Krz*_*ski 10

用于jQuery的Python等价物是pyQuery.在该链接下,您可以找到用法示例.您还可以在GitHub上访问PyQuery.


dsg*_*fin 5

虽然pyQuery是jQuery的等价物,但从你的用例来看,我认为像BeautifulSoup这样的东西可能更适合你想要做的事情.

以下内容摘自Beautiful Soup官方网站:

Beautiful Soup是一个Python库,专为快速周转项目而设计,如屏幕抓取.三个功能使其功能强大:

  1. Beautiful Soup提供了一些简单的方法和Pythonic习语,用于导航,搜索和修改解析树:用于剖析文档和提取所需内容的工具包.编写应用程序不需要太多代码

  2. Beautiful Soup会自动将传入的文档转换为Unicode,将传出的文档转换为UTF-8.您不必考虑编码,除非文档没有指定编码并且Beautiful Soup不能自动检测编码.然后你只需要指定原始编码.

  3. Beautiful Soup位于流行的Python解析器之上,如lxml和html5lib,允许您尝试不同的解析策略或交易速度以获得灵活性.

美丽的汤解析你给它的任何东西,并为你做树遍历的东西.您可以告诉它"查找所有链接",或"查找类externalLink的所有链接",或"查找其网址匹配的所有链接"foo.com",或"查找具有粗体文本的表格标题,然后给出我那个文字."