我有一个包含多个列的数据框,但我感兴趣的是三个.这些是name
,year
和goals_scored
.这些列中没有一个是唯一的,例如我有如下所示的行:
Name Year Goals_scored
John Smith 2014 3
John Smith 2014 2
John Smith 2014 0
John Smith 2015 1
John Smith 2015 1
John Smith 2015 2
John Smith 2015 1
John Smith 2015 0
John Smith 2016 1
John Smith 2016 0
Run Code Online (Sandbox Code Playgroud)
我想要做的是创建一个新的数据框,我有4列.一个用于名称,然后用于2014年,2015年和2016年的每一个.最后三列是相关年份的目标总和的总和.所以使用上面的数据看起来像:
Name 2014 2015 2016
John Smith 5 5 1
Run Code Online (Sandbox Code Playgroud)
为了使情况变得更糟,他们只希望它包括那些有三年的东西的名字.
谁能指出我正确的方向?
您好希望有人能提供帮助。我有一个数据框,其中的一列包含名称列表。这些名称在某些情况下会重复出现,但并非全部重复。我正在尝试绘制一个图形,其中x轴包含名称,然后y轴包含名称出现在列中的次数。
我使用以下方法来计算每个名称出现的时间。
df.groupby('name').name.count()
Run Code Online (Sandbox Code Playgroud)
然后尝试使用以下内容绘制图形。但是,我得到一个关键错误消息。
df.plot.bar(x='name', y=df.groupby('name').name.count())
Run Code Online (Sandbox Code Playgroud)
有人能告诉我我在做什么错吗?
谢谢