Mee*_*org 4 scripting download javascript
以网页上的这段代码为例。
<html><body>
<script language="javascript">
document.write("The cat");
document.write(" sat on the mat");
</script>
</body></html>
Run Code Online (Sandbox Code Playgroud)
如果我要通过 CURL 或 WGET 检索此网页,我会得到该文本,因为尚未处理 Javascript。
但是我想检索这个页面,所以我得到了 Javascript 输出的结果。所以我会得到只是..
The cat sat on the mat
Run Code Online (Sandbox Code Playgroud)
是否有一些 Linux Javascript 沙箱/模拟器/预处理器或类似的东西可以让我将该文本处理为 html。我知道 Javascript 很复杂,不要指望 100% 转换。但即使获得一些基本的转换也会有帮助。
我知道这是可能的,因为我确信谷歌在索引网页时会这样做,以获得他们索引的网页的最佳结果。
没有“Javascript 到 HTML 转换器”这样的东西。Javascript 是一种编程语言,而不是一种标记语言。浏览器不会将 Javascript 转换为 HTML,它们执行 Javascript 代码,而 Javascript 代码的作用是修改 HTML。您想要的是一个可以处理 HTML 文档的 Javascript 解释器。
一种方法是在幕后使用浏览器引擎。Selenium和Watir(都是 Web 应用程序测试引擎)是调用 Web 浏览器并使用脚本驱动它的流行选择——请参阅除了 SeleniumRC 之外,是否还有其他好的工具可以获取网页,包括由 JavaScript 后期绘制的内容?.
还有最近的接口JavaScript和DOM几种编程语言,如Jswebkit在Python中(例如)。
另一种可能性是运行node.js,它是一个独立的 JavaScript 解释器(example)。