熊猫数据框分配不更新数据框

Mar*_*man 4 python data-analysis pandas jupyter

我制作了Iris 数据集的Pandas 数据框,我想在其中添加 4 个额外的列。列的内容必须是 SepalRatio、PetalRatio、SepalMultiplied、PetalMultiplied。我使用 DataFrame 的 assign() 函数来添加这四列,但 DataFrame 保持不变。

我添加列的代码是:

iris.assign(SepalRatio = iris['SepalLengthCm'] / `iris['SepalWidthCm']).assign(PetalRatio = iris['PetalLengthCm'] / iris['PetalWidthCm']).assign(SepalMultiplied = iris['SepalLengthCm'] * iris['SepalWidthCm']).assign(PetalMultiplied = iris['PetalLengthCm'] * iris['PetalWidthCm'])`
Run Code Online (Sandbox Code Playgroud)

在 Jupyter notebook 中执行时,会显示正确的表,但如果我使用打印语句,则不会添加四列。

Jupyter 笔记本中的输出:

    Id  SepalLengthCm   SepalWidthCm    PetalLengthCm   PetalWidthCm    Species SepalRatio  PetalRatio  SepalMultiplied PetalMultiplied
0   1   5.1 3.5 1.4 0.2 Iris-setosa 1.457143    7.000000    17.85   0.28
1   2   4.9 3.0 1.4 0.2 Iris-setosa 1.633333    7.000000    14.70   0.28
2   3   4.7 3.2 1.3 0.2 Iris-setosa 1.468750    6.500000    15.04   0.26
3   4   4.6 3.1 1.5 0.2 Iris-setosa 1.483871    7.500000    14.26   0.30
4   5   5.0 3.6 1.4 0.2 Iris-setosa 1.388889    7.000000    18.00   0.28
5   6   5.4 3.9 1.7 0.4 Iris-setosa 1.384615    4.250000    21.06   0.68
6   7   4.6 3.4 1.4 0.3 Iris-setosa 1.352941    4.666667    15.64   0.42
7   8   5.0 3.4 1.5 0.2 Iris-setosa 1.470588    7.500000    17.00   0.30
8   9   4.4 2.9 1.4 0.2 Iris-setosa 1.517241    7.000000    12.76   0.28
9   10  4.9 3.1 1.5 0.1 Iris-setosa 1.580645    15.000000   15.19   0.15
Run Code Online (Sandbox Code Playgroud)

打印数据帧后的输出:

      Id  SepalLengthCm  SepalWidthCm  PetalLengthCm  PetalWidthCm  \
0      1            5.1           3.5            1.4           0.2   
1      2            4.9           3.0            1.4           0.2   
2      3            4.7           3.2            1.3           0.2   
3      4            4.6           3.1            1.5           0.2   
4      5            5.0           3.6            1.4           0.2   
5      6            5.4           3.9            1.7           0.4   
6      7            4.6           3.4            1.4           0.3   
7      8            5.0           3.4            1.5           0.2   
8      9            4.4           2.9            1.4           0.2   
9     10            4.9           3.1            1.5           0.1 

            Species  
0       Iris-setosa  
1       Iris-setosa  
2       Iris-setosa  
3       Iris-setosa  
4       Iris-setosa  
5       Iris-setosa  
6       Iris-setosa  
7       Iris-setosa  
8       Iris-setosa  
9       Iris-setosa  
Run Code Online (Sandbox Code Playgroud)

jez*_*ael 7

您需要将输出分配给变量,例如:

iris = iris.assign(SepalRatio = iris['SepalLengthCm'] / iris['SepalWidthCm']).assign(PetalRatio = iris['PetalLengthCm'] / iris['PetalWidthCm']).assign(SepalMultiplied = iris['SepalLengthCm'] * iris['SepalWidthCm']).assign(PetalMultiplied = iris['PetalLengthCm'] * iris['PetalWidthCm'])
Run Code Online (Sandbox Code Playgroud)

更好的是只使用一个assign

iris = iris.assign(SepalRatio = iris['SepalLengthCm'] / iris['SepalWidthCm'],
                   PetalRatio = iris['PetalLengthCm'] / iris['PetalWidthCm'],
                   SepalMultiplied = iris['SepalLengthCm'] * iris['SepalWidthCm'],
                   PetalMultiplied = iris['PetalLengthCm'] * iris['PetalWidthCm'])
Run Code Online (Sandbox Code Playgroud)

  • 简单,但有时编码器会花 30 分钟来找到这个问题的解决方案......我有时会寻找欺骗者,但找到欺骗者并不那么容易,更快的是创建答案。 (4认同)