如何使用熊猫数据框中的纬度和经度计算距离?

ych*_*ain 3 geolocation latitude-longitude python-3.x pandas

我有一个具有两列纬度和经度和 863 行的数据框,因此每行都有一个由纬度和经度定义的点坐标。现在我想计算所有行之间的距离(以公里为单位)。我正在使用以下参考链接来获取纬度和经度对之间的距离。如果有几行,我可以使用参考链接完成。但是我有大行,我想我需要一个循环来解决问题。由于我是 python 的新手,我无法创建一个逻辑来循环这个想法。

参考链接: 根据纬度/经度获取两点之间的距离

我的数据框如下所示:

read_randomly_generated_lat_lon.head(3)
Lat          Lon
43.937845   -97.905537
44.310739   -97.588820
44.914698   -99.003517
Run Code Online (Sandbox Code Playgroud)

ari*_*rmo 7

你可以使用 scikit-learn 来做到这一点:

import numpy as np
from sklearn.neighbors import DistanceMetric

dfr = df.copy()
dfr.Lat = np.radians(df.Lat)
dfr.Lon = np.radians(df.Lon)
hs = DistanceMetric.get_metric("haversine")
(hs.pairwise(dfr)*6371) # Earth radius in km
Run Code Online (Sandbox Code Playgroud)

输出:

array([[  0.        ,  48.56264446, 139.2836099 ],
       [ 48.56264446,   0.        , 130.57312786],
       [139.2836099 , 130.57312786,   0.        ]])
Run Code Online (Sandbox Code Playgroud)

请注意,输出是一个方阵,其中元素 (i,j) 是第 i 行和第 j 行之间的距离

这似乎比使用带有自定义haversine函数的scipy 的 pdist 更快