相关疑难解决方法(0)

Pandas DataFrame Groupby两列并获得计数

我有以下格式的pandas数据帧:

df = pd.DataFrame([[1.1, 1.1, 1.1, 2.6, 2.5, 3.4,2.6,2.6,3.4,3.4,2.6,1.1,1.1,3.3], list('AAABBBBABCBDDD'), [1.1, 1.7, 2.5, 2.6, 3.3, 3.8,4.0,4.2,4.3,4.5,4.6,4.7,4.7,4.8], ['x/y/z','x/y','x/y/z/n','x/u','x','x/u/v','x/y/z','x','x/u/v/b','-','x/y','x/y/z','x','x/u/v/w'],['1','3','3','2','4','2','5','3','6','3','5','1','1','1']]).T
df.columns = ['col1','col2','col3','col4','col5']
Run Code Online (Sandbox Code Playgroud)

DF:

   col1 col2 col3     col4 col5
0   1.1    A  1.1    x/y/z    1
1   1.1    A  1.7      x/y    3
2   1.1    A  2.5  x/y/z/n    3
3   2.6    B  2.6      x/u    2
4   2.5    B  3.3        x    4
5   3.4    B  3.8    x/u/v    2
6   2.6    B    4    x/y/z    5
7   2.6    A  4.2        x    3
8   3.4    B  4.3  x/u/v/b    6 …
Run Code Online (Sandbox Code Playgroud)

python dataframe pandas

138
推荐指数
6
解决办法
32万
查看次数

相当于py中R的"表"

R中,我们可以找到每个项目的频率table.这是R中的一个例子:

x <- c(1,1,1,1,2,2)
y <- c("a","a","b","a","a","b")
table(x,y)
#   y
#x   a b
#  1 3 1
#  2 1 1
Run Code Online (Sandbox Code Playgroud)

如何在python中实现它,而x和y是DataFrame?我是Python的新手,我搜索了很多,但我无法找到答案.我应该提一下,我读过这篇文章,但我无法在我的案例中实现它?

python r

7
推荐指数
2
解决办法
5553
查看次数

标签 统计

python ×2

dataframe ×1

pandas ×1

r ×1