列出R或Python中具有相同值的CSV单元格?

ger*_*hur 0 python excel r

我有一个包含代理商名称和地址的CSV.如果我想要一组具有相同地址的代理商名称(特别是相同的邮政编码),我该如何在R或Python中执行此操作?无论哪种方式最有效率都是可取的,但我仍然在学习这两种方法.Google Refine已经为我提供了每个邮政编码群集的计数,但我只需要知道哪些代理商对应那些拉链.

PS.是的我知道邮政编码不好依靠; 这一点就是为了说明这一点.

输入数据示例:

在此输入图像描述

最终输出(稍后将与shapefile合并):

在此输入图像描述

Ble*_*der 5

你应该能够构建一个字典:

import csv

from collections import defaultdict

agencies = defaultdict(list)

with open('file.csv', 'r') as handle:
    reader = csv.reader(handle)

    for row in reader:
        agencies[row[2]].append(row[0])
Run Code Online (Sandbox Code Playgroud)

现在,agencies包含邮政编码到代理商的映射.