地理位置数据库(例如http://www.maxmind.com/)从哪些来源获取其数据?据我了解,IP注册处(如ARIN和RIPE)仅保存有关分配了IP范围的公司的信息,因此必须来自ISP的权利吗?如果是这样,则必须有某种方式来访问它。
小智 5
我有同样的问题,并找到了以下信息。
当我使用 MaxMind 信息时,我希望它们的有效性他们的网站声明:“MaxMind 定期测试 GeoIP2 和 GeoIP Legacy 数据库的准确性。在我们最近的测试中,可下载的数据库在国家层面的准确率为 99.8%,准确率为 90%在美国的州一级,50 公里范围内的美国城市准确率为 86%。更多详细信息,请参阅 GeoIP2 城市覆盖范围和准确度。MaxMind 定期测试 GeoIP2 产品和服务中使用的数据的准确度。准确度计算方法是根据 MaxMind 的 GeoIP2 Precision Web 服务以及 GeoIP2 City 和 GeoLite2 City 数据库产品中的数据检查已知的 Web 用户 IP 地址和位置对。”
来源:https : //support.maxmind.com/geoip-faq/geoip2-and-geoip-legacy-databases/how-accurate-are-your-geoip2-and-geoip-legacy-databases/
对于 ISP 信息,他们指出:“ISP 名称在美国的准确率约为 95%。在美国以外,准确率从 50% 到 80% 不等,具体取决于国家/地区。对于互联网用户较多的国家/地区,数据通常更准确。 ”
来源: https : //www.maxmind.com/en/geoip2-isp-database
至于过程,以下答案似乎很有帮助:
IP 地理定位数据库通常基于以下内容收集:
IP 爬取——跟踪路由和其他旨在映射 Internet 路由基础结构的自动化方法。考虑到任务(超过 40 亿个不断分配、解除分配或移动的 IP 地址),这些技术可能相当复杂且耗时。此外,使用 IPv6,这将变得更加困难。
由与 IP 地址相关的用户提供的数据——一些公司获取与 IP 地址相关的匿名用户数据(邮政编码/城市),并使用它来帮助填充他们的数据库。显然,需要仔细清理这些数据以确保其可靠。
与 ISP 共享关系。像我这样的公司 (Digital Element... http://www.digitalelement.com/ ) 经常与 ISP 联系以确保我们的数据准确无误,因为他们不希望他们的用户被诸如Hulu 或 ESPN 并且可能在他们应该能够获得内容时被阻止。这些数据通常是高度准确的,假设它是最新的,因为 ISP 非常了解他们自己的 IP 地址的位置。
注册表数据——查看 ARIN、RIPE 等。[通常不那么准确。]\
有许多 MAXMIND 数据库,有些是免费的,有些是商业许可的。这些数据库中的信息部分来自其他公共数据库,例如RIPE,部分来自MAXMIND的内部处理/匹配。
如果您愿意,您可以编写自己的工具来解析 RIPE 数据库,提取所有字段并构建您自己的数据库,或者您可以付费给已经完成此操作的人。
如果您要以编程方式查询他们的数据库,dev.maxmind.com 上有适用于大多数语言的 API。
请注意 - 如果您使用 MAXMIND GeoASN 数据库从 IP 查找 ASN,AS 名称不一定与与给定 IP 关联的 ISP 名称相匹配。(例如,AS2856 解析为许多不同的组织,包括 BT 和 TalkTalk)。这就是为什么 GeoISP 数据库锁定了 IP 地址范围,而不是 ASN。
-- ab1
| 归档时间: |
|
| 查看次数: |
2397 次 |
| 最近记录: |