相关疑难解决方法(0)

单个变量的频率表

今天最后一个新手大熊猫问题:如何为单个系列生成一个表？

例如:

my_series = pandas.Series([1,2,2,3,3,3])
pandas.magical_frequency_function( my_series )

>> {
     1 : 1,
     2 : 2, 
     3 : 3
   }

Run Code Online (Sandbox Code Playgroud)

很多谷歌搜索让我进入了Series.describe()和pandas.crosstabs,但这些都不是我需要的:一个变量,按类别计算.哦,如果它适用于不同的数据类型会很好:字符串,整数等.

python statistics frequency pandas

Abe*_*Abe

2017 01-16

91
推荐指数

3
解决办法

11万
查看次数

Pandas groupby.size与series.value_counts vs collections.Counter有多个系列

有很多问题(1,2,3)处理的计数值单一系列.

但是,关于计算两个或更多系列组合的最佳方法的问题较少.解决方案呈现(1,2),但是,当和为什么要使用的每个没有讨论.

以下是三种潜在方法的基准测试.我有两个具体问题:

为什么grouper效率更高count？我预计count它会更高效,因为它在C中实现.grouper即使列数从2增加到4 ,优越的性能仍然存在.
为什么这么多value_counter表现不佳grouper？这是由于从列表构建列表或系列的成本吗？

我理解输出是不同的,这也应该告知选择.例如,使用连续numpy数组与字典理解相比,按计数过滤更有效:

x, z = grouper(df), count(df)
%timeit x[x.values > 10]                        # 749µs
%timeit {k: v for k, v in z.items() if v > 10}  # 9.37ms

Run Code Online (Sandbox Code Playgroud)

然而,我的问题的重点是在一系列与字典中建立可比较结果的表现.我的C知识是有限的,但我会感谢任何可以指出这些方法的基础逻辑的答案.

基准代码

import pandas as pd
import numpy as np
from collections import Counter

np.random.seed(0)

m, n = …

Run Code Online (Sandbox Code Playgroud)

python counter dictionary dataframe pandas

jpp*_*jpp

2018 05-18

30
推荐指数

1
解决办法

2975
查看次数

计算pandas DataFrame列中的值的频率

我想计算每个值出现在数据帧中的次数.

这是我的数据框 - df:

Run Code Online (Sandbox Code Playgroud)

我想要计数字典:

恩. counts = {N: 14, C:2, S:4}

我试过df['status']['N']但它给了但keyError也df['status'].value_counts没有用.

python django dataframe pandas

Kis*_*han

2016 03-15

23
推荐指数

3
解决办法

6万
查看次数

按列中值的频率排序 - Pandas

我在数据框中有一列

水果
苹果
芒果
香蕉
苹果
芒果
香蕉
苹果
芒果
葡萄

我想按其中出现的值的频率对此列进行排序，因此数据框现在应该是：

水果
苹果
苹果
苹果
香蕉
香蕉
香蕉
芒果
芒果
葡萄

谢谢！

python sorting pandas

Mur*_*_07

lucky-day

4
推荐指数

1
解决办法

5713
查看次数

熊猫计算一列中值的出现次数

我有一个只有一列和大约 80 万行的长数据框。我的数据框看起来像这样

Run Code Online (Sandbox Code Playgroud)

所以我需要的是计算每个值的出现次数并将其保存到数据帧中，因此结果将是这样的

Run Code Online (Sandbox Code Playgroud)

我试过使用，df.groupby(0)但它只返回一个对象。如何获得两列数据框（或 1 列和显示值的行索引）？

python pandas

msh*_*eeb

2018 11-01

3
推荐指数

1
解决办法

7859
查看次数

数不。数据帧熊猫中的特定值

我是数据分析方面的新手。我正在尝试使用 python 分析数据集。

我想数不。幸存列中的 1s
性别栏的男、女人数

PassengerId Survived Pclass Sex 0 1 0 3 male 1 2 1 1 female 2 3 1 3 male 3 4 1 1 female 4 5 0 3 male

我试过 groupby() 但它给出了错误。

In[88] titanic_data.groupby('Survived') Out[88] <pandas.core.groupby.DataFrameGroupBy object at 0x000000000BFFE588>

请提出解决方案

python numpy pandas data-science

Rah*_*ena

2016 07-28

-2
推荐指数

1
解决办法

3376
查看次数

标签统计

pandas ×6

python ×6

dataframe ×2

counter ×1

data-science ×1

dictionary ×1

django ×1

frequency ×1

numpy ×1

sorting ×1

statistics ×1

单个变量的频率表

Pandas groupby.size与series.value_counts vs collections.Counter有多个系列

计算pandas DataFrame列中的值的频率

按列中值的频率排序 - Pandas

熊猫计算一列中值的出现次数

数不。数据帧熊猫中的特定值

标签 统计

标签统计