ych*_*ain 3 geolocation latitude-longitude python-3.x pandas
我有一个具有两列纬度和经度和 863 行的数据框,因此每行都有一个由纬度和经度定义的点坐标。现在我想计算所有行之间的距离(以公里为单位)。我正在使用以下参考链接来获取纬度和经度对之间的距离。如果有几行,我可以使用参考链接完成。但是我有大行,我想我需要一个循环来解决问题。由于我是 python 的新手,我无法创建一个逻辑来循环这个想法。
参考链接: 根据纬度/经度获取两点之间的距离
我的数据框如下所示:
read_randomly_generated_lat_lon.head(3)
Lat Lon
43.937845 -97.905537
44.310739 -97.588820
44.914698 -99.003517
Run Code Online (Sandbox Code Playgroud)
你可以使用 scikit-learn 来做到这一点:
import numpy as np
from sklearn.neighbors import DistanceMetric
dfr = df.copy()
dfr.Lat = np.radians(df.Lat)
dfr.Lon = np.radians(df.Lon)
hs = DistanceMetric.get_metric("haversine")
(hs.pairwise(dfr)*6371) # Earth radius in km
Run Code Online (Sandbox Code Playgroud)
输出:
array([[ 0. , 48.56264446, 139.2836099 ],
[ 48.56264446, 0. , 130.57312786],
[139.2836099 , 130.57312786, 0. ]])
Run Code Online (Sandbox Code Playgroud)
请注意,输出是一个方阵,其中元素 (i,j) 是第 i 行和第 j 行之间的距离
这似乎比使用带有自定义haversine函数的scipy 的 pdist 更快
| 归档时间: |
|
| 查看次数: |
4110 次 |
| 最近记录: |