我有一个包含代理商名称和地址的CSV.如果我想要一组具有相同地址的代理商名称(特别是相同的邮政编码),我该如何在R或Python中执行此操作?无论哪种方式最有效率都是可取的,但我仍然在学习这两种方法.Google Refine已经为我提供了每个邮政编码群集的计数,但我只需要知道哪些代理商对应那些拉链.
PS.是的我知道邮政编码不好依靠; 这一点就是为了说明这一点.
输入数据示例:

最终输出(稍后将与shapefile合并):

你应该能够构建一个字典:
import csv
from collections import defaultdict
agencies = defaultdict(list)
with open('file.csv', 'r') as handle:
reader = csv.reader(handle)
for row in reader:
agencies[row[2]].append(row[0])
Run Code Online (Sandbox Code Playgroud)
现在,agencies包含邮政编码到代理商的映射.