我有一个包含2列地址和ID的数据帧.我想将ID与字典中的相同地址合并
import pandas as pd, numpy as np
df = pd.DataFrame({'Address' : ['12 A', '66 C', '10 B', '10 B', '12 A', '12 A'],
'ID' : ['Aa', 'Bb', 'Cc', 'Dd', 'Ee', 'Ff']})
AS=df.set_index('Address')['ID'].to_dict()
print df
Address ID
0 12 A Aa
1 66 C Bb
2 10 B Cc
3 10 B Dd
4 12 A Ee
5 12 A Ff
print AS
{'66 C': 'Bb', '12 A': 'Ff', '10 B': 'Dd'}
Run Code Online (Sandbox Code Playgroud)
我想要的是重复项存储多个值,如:
{'66 C': ['Bb'], '12 A': ['Aa','Ee','Ff'], '10 …Run Code Online (Sandbox Code Playgroud) 我正在使用pandas和python来处理具有相同数据的列的具有不同列名的多个文件.
dataset = pd.read_csv('Test.csv', index_col=0)
cols= dataset.columns
Run Code Online (Sandbox Code Playgroud)
我在列表中有不同的列标题.
AddressCol=['sAddress','address','Adrs', 'cAddress']
Run Code Online (Sandbox Code Playgroud)
有没有办法将所有可能的列名称规范化为pandas中的"地址",以便我在不同的文件上使用该脚本?
没有pandas,我会使用类似double for循环来查看列名列表和可能的列名以及if语句来提取整个数组.