相关疑难解决方法(0)

使用每组的pandas计算唯一值

我需要ID在每个domain 数据中计算唯一值

ID, domain
123, 'vk.com'
123, 'vk.com'
123, 'twitter.com'
456, 'vk.com'
456, 'facebook.com'
456, 'vk.com'
456, 'google.com'
789, 'twitter.com'
789, 'vk.com'

Run Code Online (Sandbox Code Playgroud)

我尝试df.groupby(['domain', 'ID']).count() 但我想得到

domain, count
vk.com   3
twitter.com   2
facebook.com   1
google.com   1

Run Code Online (Sandbox Code Playgroud)

python group-by unique pandas pandas-groupby

Ars*_*nin

2018 04-12

163
推荐指数

4
解决办法

38万
查看次数

如何按对象计算pandas组列中的不同值？

我有一个pandas数据框并将其分为两列(例如col1和col2).为固定值col1和col2(即,对于A组)我可以在几个不同的值col3.我想计算第三列中不同值的数量.

例如,如果我将此作为输入:

Run Code Online (Sandbox Code Playgroud)

我想将此表(数据框)作为输出:

Run Code Online (Sandbox Code Playgroud)

python group-by pandas

Rom*_*man

2013 07-29

22
推荐指数

2
解决办法

5万
查看次数

使用pandas groupby计算唯一值

我有以下形式的数据:

df = pd.DataFrame({
    'group': [1, 1, 2, 3, 3, 3, 4],
    'param': ['a', 'a', 'b', np.nan, 'a', 'a', np.nan]
})
print(df)

#    group param
# 0      1     a
# 1      1     a
# 2      2     b
# 3      3   NaN
# 4      3     a
# 5      3     a
# 6      4   NaN

Run Code Online (Sandbox Code Playgroud)

组内的非空值始终相同.我想为每个组(它存在的位置)计算一次非空值,然后查找每个值的总计数.

我目前正在以下(笨重和低效)的方式做到这一点:

param = []
for _, group in df[df.param.notnull()].groupby('group'):
    param.append(group.param.unique()[0])
print(pd.DataFrame({'param': param}).param.value_counts())

# a    2
# b    1

Run Code Online (Sandbox Code Playgroud)

我确信有一种方法可以更干净地完成这项工作并且不使用循环,但我似乎无法解决这个问题.任何帮助将非常感激.

python group-by pandas

use*_*046

lucky-day

20
推荐指数

4
解决办法

4万
查看次数

熊猫 - 每列计算不同的值

我有一个如下所示的数据框:

Id ActivityId ActivityCode

1   2           3
1   2           4
1   3           2

Run Code Online (Sandbox Code Playgroud)

我需要计算与Id相关的不同活动ID.

在上面的示例中,id 1将返回2,因为该id有2个不同的活动ID.

SQL看起来像这样:

SELECT COUNT(DISTINCT ActivityId) FROM table GROUP BY Id

Run Code Online (Sandbox Code Playgroud)

我怎么在熊猫里这样做？

(如果可能的话,我想知道是否有办法在字典中获得结果,而无需手动迭代)

python dictionary group-by pandas

kja*_*nko

2017 06-01

3
推荐指数

1
解决办法

895
查看次数

标签统计

group-by ×4

pandas ×4

python ×4

dictionary ×1

pandas-groupby ×1

unique ×1

使用每组的pandas计算唯一值

如何按对象计算pandas组列中的不同值？

使用pandas groupby计算唯一值

熊猫 - 每列计算不同的值

标签 统计

标签统计