我有一个名为'df'的数据框,我想用一个数据框中的列范围内的值替换另一列中的相应值.
6 <=年龄<11然后1
11 <=年龄<16然后2
16 <=年龄<21然后3
21岁<=年龄4岁
age
86508 12.0
86509 6.0
86510 7.0
86511 8.0
86512 10.0
86513 15.0
86514 15.0
86515 16.0
86516 20.0
86517 23.0
86518 23.0
86519 7.0
86520 18.0
Run Code Online (Sandbox Code Playgroud)结果是
age stage
86508 12.0 2
86509 6.0 1
86510 7.0 1
86511 8.0 1
86512 10.0 1
86513 15.0 2
86514 15.0 2
86515 16.0 2
86516 20.0 3
86517 23.0 4
86518 23.0 4
86519 7.0 1
86520 18.0 3
Run Code Online (Sandbox Code Playgroud)
谢谢.
我正在使用python中的数据框架.如何在特定四分位数(ex q1,q2,q3,q4)内指示具有特定列的值的所有行"rate"?这里,interval是'rate'的范围,所以[-0,0.913056]是整个范围.我想指出每行中'rate'的值将落入范围的哪个分位数.
name rate
0 3POWER ENERGY GROUP INC -0.000000
1 808 RENEWABLE ENERGY CORP -0.112192
2 YORK WATER CO 0.774955
3 ZTO EXPRESS (CAYM) INC -ADR 0.086352
4 AEP GENERATING CO 0.850960
5 AEP TEXAS CENTRAL CO 0.600301
6 AIR T INC 0.254511
7 ALABAMA GAS CORP 0.611631
8 ALABAMA POWER CO 0.913056
9 ALLEGIANT TRAVEL CO 0.227421
10 COMCAST CORP 0.012037
11 HAWAIIAN ELECTRIC CO 0.670980
12 HAWAIIAN ELECTRIC INDS 0.775778
Run Code Online (Sandbox Code Playgroud)
如果是这样的话.
name rate quartile
0 3POWER ENERGY …Run Code Online (Sandbox Code Playgroud) 有没有办法在使用 python pandas 读取 excel 文件时添加具有特定值的列?
现在我有两个步骤,但我需要做 30 多个文件,所以我想找到优雅的方法来做到这一点!
1) df_2007 = pd.read_excel('may2007_dl.xls')
2) df_2007['year'] = 2007
Run Code Online (Sandbox Code Playgroud)
谢谢。