NodeJS的htmlparser教程?

son*_*gyy 3 html-parsing node.js

我真的不明白htmlparser自述文件.我在网上搜索但找不到合适的教程(或其他NodeJS解析器).

我相信在大多数情况下,如果没有完整和旧库的教程,主要是因为它很容易做,因此人们并不真的觉得需要为它编写教程...但我发现NodeJS html解析器是很难理解......

小智 6

你应该看看htmlparser2.它是较新的htmlparser,它有一个不错的自述文件.我倾向于使用它的方式不流畅,因此看起来像这样:

handler = new htmlparser.DomHandler(function(err, dom) {
    // ... DO CODE HERE
})
new htmlparser.Parser(handler).parseComplete(html_string)
Run Code Online (Sandbox Code Playgroud)

对于处理程序函数内部的代码,我使用了soupselect,因为它已经记录并且我很懒,但是htmlparser2的人建议使用domutils,但它没有文档.