小编rba*_*rba的帖子

通过它们的总和来规范化大熊猫数据帧

我有一个包含光谱数据和元数据的熊猫数据帧.列用多索引标记,以便df['wvl']给出光谱并df['meta']给出元数据.在df['wvl']列标签内是光谱仪通道的波长值.

我想要做的是df['wvl']通过该行的总和来规范化每一行,以便将行中的值相加得到总计1.0.

这是数据帧的一行:

df['wvl'].iloc[0]
246.050003     128.533035
246.102005     102.756321
246.156006      99.930775
...    
848.697205     121.313347
848.896423     127.011662
849.095703     123.234168
Name: 0, dtype: float64
Run Code Online (Sandbox Code Playgroud)

但当我做类似的事情时:

df['wvl'].iloc[0]=df['wvl'].iloc[0]/df['wvl'].iloc[0].sum()
Run Code Online (Sandbox Code Playgroud)

什么都没发生!我得到完全相同的值:

df['wvl'].iloc[0]
246.050003     128.533035
246.102005     102.756321
246.156006      99.930775
...    
848.697205     121.313347
848.896423     127.011662
849.095703     123.234168
Name: 0, dtype: float64
Run Code Online (Sandbox Code Playgroud)

如果我创建一个临时变量来保存行,我可以很好地进行规范化:

temp=df['wvl'].iloc[0]

temp=temp/temp.sum()

temp
246.050003    0.000027
246.102005    0.000022
246.156006    0.000021
                ...   
848.697205    0.000026
848.896423    0.000027
849.095703    0.000026
Name: 0, dtype: float64
Run Code Online (Sandbox Code Playgroud)

但是,如果我尝试用规范化的临时变量替换数据帧行,则没有任何反应:

df['wvl'].iloc[0]=temp

df['wvl'].iloc[0]
246.050003     128.533035
246.102005     102.756321
246.156006      99.930775 …
Run Code Online (Sandbox Code Playgroud)

python pandas

21
推荐指数
1
解决办法
2万
查看次数

标签 统计

pandas ×1

python ×1