在 GeoDataFrame 中有超过 1 个几何列是不好的做法吗?

var*_*ela 5 gis polygon series shapely geopandas

我正在尝试创建一个每行 2 个邮政编码的 GeoDataFrame,我想比较它们之间的距离。我列出了大约 220 个邮政编码的列表,并对它们运行了 itertools 组合以获取所有组合,然后将元组解压为两列

code_combo = list(itertools.combinations(df_with_all_zip_codes['code'], 2))
df_distance_ctr = pd.DataFrame(code_combo, columns=['first_code','second_code'])
Run Code Online (Sandbox Code Playgroud)

然后我做了一些标准的 Pandas 合并和列重命名,以将多边形/几何列从原始地理数据框中获取到这个新的,就在相应的邮政编码列旁边。问题是我似乎无法将多边形列读取为几何体,即使在 1.) 尝试将数据框转换为地理数据框之后 - AttributeError: No geometry data set yet , 2.) 将 wkt.loads 应用到几何列 - AttributeError: 'MultiPolygon' object has no attribute 'encode' 。 我试图寻找一种将系列转换为 geoseries 的方法,但在 SO 和文档上都找不到任何内容。谁能指出我可能出错的地方?

小智 3

查看__init__GeoDataFrame 的方法https://github.com/geopandas/geopandas/blob/master/geopandas/geodataframe.py,看起来 GDF 一次只能有一列。不过,您创建的其他列中仍应包含几何对象。

由于每列中仍然有几何对象,因此您可以编写一个使用 Shapelydistance方法的方法,如下所示:

import pandas as pd
import geopandas
from shapely.geometry import Point
import matplotlib.pyplot as plt

lats = [-34.58, -15.78, -33.45, 4.60, 10.48]
lons = [-58.66, -47.91, -70.66, -74.08, -66.86]
df = pd.DataFrame(
    {'City': ['Buenos Aires', 'Brasilia', 'Santiago', 'Bogota', 'Caracas'],
     'Country': ['Argentina', 'Brazil', 'Chile', 'Colombia', 'Venezuela'],
     'Latitude': lats,
     'Longitude': lons})

df['Coordinates'] = list(zip(df.Longitude, df.Latitude))
df['Coordinates'] = df['Coordinates'].apply(Point)

df['Coordinates_2'] = list(zip(lons[::-1], lats[::-1]))
df['Coordinates_2'] = df['Coordinates_2'].apply(Point)

gdf = geopandas.GeoDataFrame(df, geometry='Coordinates')


def get_distance(row):
    distance = row.Coordinates.distance(row.Coordinates_2)
    print(distance)
    return distance

gdf['distance'] = gdf.apply(lambda row: get_distance(row), axis=1)
Run Code Online (Sandbox Code Playgroud)

至于AttributeError: 'MultiPolygon' object has no attribute 'encode'. MultiPolygon是一个 Shapely 几何类。encode通常是字符串对象上的方法,因此您可以删除对wkt.loads.