使用网站的 URL 提取技术

Jaf*_*son 3 source-code 14.04

我想知道是否可以通过使用 Ubuntu 获取其 URL 来检索用于构建网站的技术。
例如说:如果我有 URL:https :
//www.wikipedia.org/

我想知道用于建立这个网站的技术。
输出将是:

PHP, HHVM, Vanish, AddThis and many others.
Run Code Online (Sandbox Code Playgroud)

有什么办法可以更快地完成这项工作吗?
还请记住,我有一个网站列表文件,我想提取这些网站的网络技术并将它们放在 URL 后面的文件中(逐行)。请让我知道这是否可以使用 Ubuntu 命令或 Ubuntu 上的任何软件。

Ano*_*Guy 5

我建议仅使用 Ubuntu 就不可能做到这一点。

您可以使用 Lynx 之类的终端浏览器或 curl 之类的命令获取数据,但解析数据将非常耗时。

这是您需要大量脚本才能完成的事情。我认为这将是一个自己的项目。

我做了一些研究,之前也有人问过类似的问题,但它们很少而且相距甚远。

您可以使用诸如https://builtwith.com 之类的在线工具来查找详细信息。

例如,它显示 techcrunch.com

  • 使用 NGINX 作为网络服务器
  • 使用来自 Godaddy 的 SSL 证书;WordPress
  • 显示 SSL 重定向
  • WordPress的DNS
  • 使用邮戳;航海;Google Apps for Business 并具有 SPF 设置
  • 由 Wordpress.com 托管
  • 使用 Wordpress VIP 作为 CMS
  • 使用 PHP 解释器
  • 有大量的分析;广告商和跟踪
  • 使用很多 JS 库(都在网站上列出),包括 jQuery 和 Backbone.js 之类的东西
  • 使用美国在线;Tube Mogul 和 TidalTV 媒体

那里有很多信息,你必须自己通读,但它是一个很好的工具。

希望有帮助!

祝你好运 :)

这也可能是/sf/ask/27771761/的重复问题

上述问题中还列出了其他在线工具。