nak*_*120 4 api google-maps r census ggmap
我有一个包含经度和纬度坐标的数据集。我想检索相应的人口普查区。是否有可以允许我执行此操作的数据集或api?
我的数据集如下所示:
lat lon
1 40.61847 -74.02123
2 40.71348 -73.96551
3 40.69948 -73.96104
4 40.70377 -73.93116
5 40.67859 -73.99049
6 40.71234 -73.92416
Run Code Online (Sandbox Code Playgroud)
我想添加一列带有相应的人口普查区域的信息。
最终输出应类似于以下内容(这些不是正确的数字,只是一个示例)。
lat lon Census_Tract_Label
1 40.61847 -74.02123 5.01
2 40.71348 -73.96551 20
3 40.69948 -73.96104 41
4 40.70377 -73.93116 52.02
5 40.67859 -73.99049 58
6 40.71234 -73.92416 60
Run Code Online (Sandbox Code Playgroud)
小智 6
该tigris软件包包含一个名为的函数call_geolocator_latlon,该函数应该可以执行您想要的操作。这是一些使用的代码
> coord <- data.frame(lat = c(40.61847, 40.71348, 40.69948, 40.70377, 40.67859, 40.71234),
+ long = c(-74.02123, -73.96551, -73.96104, -73.93116, -73.99049, -73.92416))
>
> coord$census_code <- apply(coord, 1, function(row) call_geolocator_latlon(row['lat'], row['long']))
> coord
lat long census_code
1 40.61847 -74.02123 360470152003001
2 40.71348 -73.96551 360470551001009
3 40.69948 -73.96104 360470537002011
4 40.70377 -73.93116 360470425003000
5 40.67859 -73.99049 360470077001000
6 40.71234 -73.92416 360470449004075
Run Code Online (Sandbox Code Playgroud)
据我了解,这15位数字代码是由几个代码组成的(前两个是州,接下来的三个是县,后面的六个是地区)。要仅获取人口普查区代码,我只需使用该substr函数即可提取出这六个数字。
> coord$census_tract <- substr(coord$census_code, 6, 1)
> coord
lat long census_code census_tract
1 40.61847 -74.02123 360470152003001 015200
2 40.71348 -73.96551 360470551001009 055100
3 40.69948 -73.96104 360470537002011 053700
4 40.70377 -73.93116 360470425003000 042500
5 40.67859 -73.99049 360470077001000 007700
6 40.71234 -73.92416 360470449004075 044900
Run Code Online (Sandbox Code Playgroud)
希望对您有所帮助!
| 归档时间: |
|
| 查看次数: |
1542 次 |
| 最近记录: |