我有一些必须在工作中使用的“公司”系统。其中一些很糟糕,有框架、弹出窗口等。
我正在考虑使用 curl 或类似的东西自动化一些东西。我需要登录,点击超链接,设置一些数据,然后他们做一些发布。
是否可以使用卷曲?或者我会更好地使用 Selenium 之类的东西吗?
以网页上的这段代码为例。
<html><body>
<script language="javascript">
document.write("The cat");
document.write(" sat on the mat");
</script>
</body></html>
Run Code Online (Sandbox Code Playgroud)
如果我要通过 CURL 或 WGET 检索此网页,我会得到该文本,因为尚未处理 Javascript。
但是我想检索这个页面,所以我得到了 Javascript 输出的结果。所以我会得到只是..
The cat sat on the mat
Run Code Online (Sandbox Code Playgroud)
是否有一些 Linux Javascript 沙箱/模拟器/预处理器或类似的东西可以让我将该文本处理为 html。我知道 Javascript 很复杂,不要指望 100% 转换。但即使获得一些基本的转换也会有帮助。
我知道这是可能的,因为我确信谷歌在索引网页时会这样做,以获得他们索引的网页的最佳结果。