我有两个数据帧:
df = pd.DataFrame({'America':["Ohio","Utah","New York"],
'Italy':["Rome","Milan","Venice"],
'Germany':["Berlin","Munich","Jena"]});
df2 = pd.DataFrame({'Cities':["Rome", "New York", "Munich"],
'Country':["na","na","na"]})
Run Code Online (Sandbox Code Playgroud)
我想在df2"城市"列上找到我的(df)上的城市,并将城市的国家/地区(df列名称)附加到df2国家/地区列
我正在尝试对“出生”列进行迭代以找到特定的年龄组,以对这些组的类别项目进行计数。
我的数据集如下所示。
data = pd.DataFrame({'birth': ['1/12/1980', '2/6/1992', '6/6/1975',
'6/3/2000'], 'problem':['cat3', 'cat2', 'cat1' , 'cat1']})
birth problem
0 1/12/1980 cat3
1 2/6/1992 cat2
2 6/6/1975 cat1
3 6/3/2000 cat1
.. ...... ....
15488 9/9/2010 cat55
Run Code Online (Sandbox Code Playgroud)
正确的输出可能是这样的:
年轻(1990-2019):Cat1:55,cat2:154,cat3:84,cat6:5554
成人:(1990-1975):Cat1:99,cat2:5121,cat3:5445
MiddleAged:(1975年及之前):cat1:99,cat2:545,cat82:644
删除标点符号,将类型转换为字符串并尝试如下操作:
for i in range(len(yas2)):
yas3.append(int(yas2[i][-4:]))
Run Code Online (Sandbox Code Playgroud)
然后迭代条件,但我无法整合和计算问题列。