基于现有列中变量的值的Pandas数据框中的新列

use*_*577 2 python pandas

我在创建一个新列时遇到困难,该新列的值基于同一数据框中现有列的值。现有的列是数字,我正尝试根据以下内容为新列提供高,中,低的分类值:

低:<(最大-最小)/ 3

中:(最大-最小)/ 3-(最大-最小)/ 3 * 2

高:>(最大-最小)/ 3 * 2

仍在学习熊猫,因此可以提供任何帮助。谢谢!

编辑:

这是我尝试过的:

df_unit_day_hour['Level_Score'] = pd.cut(df_unit_day_hour['Level_Score'], q=3, labels=['low', 'medium', 'high'])
Run Code Online (Sandbox Code Playgroud)

我认为这几乎是我所需要的,但是出现错误(KeyError)。是因为df_unit_day_hour ['Level_Score']是浮点数吗?

fir*_*ynx 5

听起来好像您想重新创建Series.cut函数

考虑下面的示例:

import numpy as np
import pandas as pd

df = pd.DataFrame({'val':np.random.choice(10, 10)})
df['cat'] = pd.cut(df['val'], [-1,2,5,10], labels=['low', 'medium', 'high'])
    df

   val   cat
0    6  high
1    2   low
2    7  high
3    7  high
4    8  high
5    8  high
6    9  high
7    6  high
8    2   low
9    0   low
Run Code Online (Sandbox Code Playgroud)