除了 WHOIS 信息之外,GeoIP 服务还使用哪些方法?

Lea*_*ner 12 networking internet ip whois geoip

我只是想知道除了检查 IP 地址 WHOIS 信息之外,GeoIP 服务如何收集有关 IP 地理位置的数据。例如,我偶然发现了这个网站,上面写着 IP 74.207.244.221 位于加利福尼亚州弗里蒙特:https ://ipinfo.io/74.207.244.221

但是我在这个 IP whois 信息上找不到这个信息。ipinfo.io 声明:

最初我们的 API 使用 MaxMind 数据,但我们一直忙于创建我们自己的地理定位数据。我们取得了很大进展,现在我们使用自己的数据来处理大约一半的请求。尽管如此,我们仍然回退到 MaxMind 数据

这让我感兴趣,ipinfo.io 和 MaxMind 等服务收集 GeoIP 数据的方式是什么?

Fan*_*que 12

此类服务通常使用 3 种方式对 IP 地址进行地理定位:

  1. 通过whois数据库搜索地址;
  2. 跟踪反向 DNS 查询以尝试根据域名记录寻找线索或跟踪发送到目的地的数据包的路径,这也可以提供线索(例如使用 traceroute)。
  3. 最后,他们使用 RTT 三角测量。

往返时间 (RTT) 三角测量是一种用于通过测量来自三个不同位置的 ping 延迟来获取 IP 地址的大致地理位置的方法。

例如,如果您有三台呈三角形分布在世界各地的服务器,并且如果您从所有三台 ping 一个 IP 地址并获得相同的延迟结果,那么这意味着该 IP 地址位于那个三角形的中心。这是三角测量的工作方式,但是,在这种情况下,它与 ICMP ping 一起使用。

您可以阅读的资源:
什么是 ping?@ Wikipedia
SIGCOMM 关于 RTT 三角剖分的论文

  • 哇,我永远不会认为存在基于 RTT 的三角测量。有趣的。因此,如果某些服务器想要避免被地理定位,它可能会在 ICMP 响应中引入随机延迟。 (6认同)

Ben*_*ing 5

我是IPinfo的创始人,所以我绝对可以提供一些有关此的详细信息!我们没有使用单一方法或单一数据源来生成我们自己的地理定位数据库(或我们的任何其他数据集,例如 IP 到公司或 IP 到运营商)。它混合了一堆不同的数据集、数据处理技术和几年来的经验教训!

一些不常提及的数据源和技术包括:

  • 来自 ISP 的直接馈送。我们的服务每天处理大约 5 亿个 API 请求,并在许多流行的知名网站上使用。因此,我们鼓励 ISP 为我们提供准确的最新地理定位数据,以便他们的客户在网络上获得出色的体验。我们一直在与越来越多的 ISP 直接合作。

  • GPS 位置数据。可以通过移动设备上的 GPS 收集精确的位置信息。您可以将其与 IP 地址和一些网络拓扑推断配对,只需进行几次测量即可计算出 IP 范围的位置。

  • 用户提交更正。当我们确实得到了错误的位置(或更改后没有更新)时,我们通常会很快从用户那里获得反馈,并且可以手动修复位置,或调整我们的算法以确保它在下一次运行时正确定位我们的数据处理管道。

对于我们的 IP 到公司数据集,我们实际上每个月都会抓取每个域名,并将我们在那里提取的数据与 IP 所有权信息、rwhois 记录等进行交叉引用。然后,我们还使用域抓取数据来显示哪些域托管在哪些 IP 地址上,以及在我们的 IP 类型分类器中,以及许多其他数据源,以确定 IP 地址主要用作住宅 ISP 的可能性,业务或托管服务提供商。我们还分析了这些页面的链接结构,并在host.io上展示了其中的一些数据。