小编Ein*_*cio的帖子

编写HTML解析器

我目前正在尝试(或计划尝试)编写一个简单的(尽可能)程序来将html文档解析为树.

谷歌搜索后,我发现许多答案说"不要做它已经完成"(或者说是这样的话); 和HTML解析器示例的引用; 还有一篇相当有说服力的文章,说明为什么不应该使用常规表达.但是我没有找到任何关于编写解析器的"正确"方法的指南.(顺便说一句,这是我尝试更多的东西,而不是任何东西,所以我非常喜欢这样做,而不是使用预制的)

我相信我只需通过阅读文档并将标签/文本等添加到树中就可以创建一个有效的XML解析器,每当我点击一个关闭标签时就会升级一个级别(同样,简单,没有花哨的线程或在这个阶段需要效率).但是,对于HTML,并非所有标记都已关闭.

所以我的问题是:你会建议什么作为处理这个问题的方法?我唯一的想法就是以与XML类似的方式对待它,但是有一个标签列表,这些标签不一定都是关闭的条件(例如<p>结束于</ p>或下一个<p >标签).

有没有其他任何(希望更好)的建议?是否有更好的方法完成这项工作?

html parsing html-parsing

26
推荐指数
4
解决办法
9216
查看次数

是否可以在window.location加载新URL后调用函数?

我希望能够在window.location完成加载URL后调用jquery函数.这可能吗?我似乎无法在网上找到任何关于此的内容.

例如:

if(parseInt(msg.status)==1) {
    window.location=msg.txt;
    alert("This URL has finished loading")
}
Run Code Online (Sandbox Code Playgroud)

谢谢,-Paul

javascript jquery

6
推荐指数
1
解决办法
8726
查看次数

标签 统计

html ×1

html-parsing ×1

javascript ×1

jquery ×1

parsing ×1