小编tom*_*omp的帖子

使用计数和比例将分类变量的 Pandas DataFrame 转换为 MultiIndex

我有一个包含多个分类变量的 Pandas DataFrame。例如:

import pandas as pd

d = {'grade':['A','B','C','A','B'], 
    'year':['2013','2013','2013','2012','2012']}

df = pd.DataFrame(d)
Run Code Online (Sandbox Code Playgroud)

在此处输入图片说明

我想将其转换为具有以下属性的 MultiIndex DataFrame:

  • 第一级索引是变量名(例如'grade')
  • 二级索引是变量内的级别(例如“A”、“B”、“C”)
  • 一列包含“n”,该级别出现的次数的计数
  • 第二列包含“比例”,即该级别表示的比例。

例如:

在此处输入图片说明

任何人都可以建议一种创建此 MultiIndex DataFrame 的方法吗?

python dataframe pandas categorical-data

3
推荐指数
1
解决办法
1370
查看次数

标签 统计

categorical-data ×1

dataframe ×1

pandas ×1

python ×1