使用Javascript将HTML字符串加载到DOM树中

xel*_*o52 6 javascript dom rhino web-crawler web-scraping

我目前正在使用一个自动化框架,它将网页拉下来进行分析,然后将其显示为一个字符串进行处理.Rhino Javascript引擎可用于帮助解析返回的网页.

似乎如果字符串(它是一个完整的网页)可以加载到DOM表示中,它将为解析和分析内容提供一个非常好的界面.

仅使用Javascript,这是一个可能和/或可行的概念吗?

编辑:

我将分解问题以澄清:说我在javascript中有一个包含html的字符串,如:


var $mywebpage = '<!DOCTYPE HTML PUB ...//snipped//... </body></html>';

将它以某种方式加载到dom对象中是否可行/现实?

jon*_*ohn 0

如果你有这个包含 html 的变量,你可以将它加载到 DOM 对象中,例如通过 id。

var mywebpage = '<!DOCTYPE HTML PUB ...//snipped//... </body></html>';

element = document.getElementById('dom-id');  //<-- element you are loading it into.

element.innerHTML = mywebpage;
Run Code Online (Sandbox Code Playgroud)