浮点数相乘在 Numpy 和 R 中给出不同的结果

Question

浮点数相乘在 Numpy 和 R 中给出不同的结果

Lon*_*mes 2 python precision numpy r ieee-754

我正在 Python (Numpy) 和 R 中进行数据分析。我的数据是一个向量 795067 X 3，根据我使用 Numpy 还是 R 计算该数据的平均值、中位数、标准差和 IQR 会产生不同的结果。我交叉检查值，看起来 R 给出了“正确”的值。

Median: 
Numpy:14.948499999999999
R: 14.9632

Mean: 
Numpy: 13.097945407088607
R: 13.10936

Standard Deviation: 
Numpy: 7.3927612774052083
R: 7.390328

IQR: 
Numpy:12.358700000000002
R: 12.3468

Run Code Online (Sandbox Code Playgroud)

两个平台上数据的最大值和最小值相同。我进行了快速测试，以更好地了解这里发生的情况。

在 Numpy 中乘以 1.2*1.2 得到 1.4（与 R 相同）。
在 Numpy 中乘以 1.22*1.22 得到 1.4884，在 R 中也是如此。
然而，在 Numpy 中乘以 1.222*1.222 得到 1.4932839999999998，这显然是错误的！在 R 中进行乘法得出正确答案 1.49324。
在 Numpy 中乘以 1.2222*1.2222 得到 1.4937728399999999，在 R 中得到 1.493773。再一次，R 是正确的。

在 Numpy 中，数字是 float64 数据类型，而在 R 中数字是 double。这是怎么回事？为什么 Numpy 和 R 给出不同的结果？我知道 R 使用 IEEE754 双精度，但我不知道 Numpy 使用什么精度。我怎样才能改变 Numpy 来给我“正确”的答案？

Answer 1

Jan*_*asa 5

Python

Python 中的语句print/函数将打印单精度浮点数。计算实际上会按照指定的精度进行。Python/numpy 默认使用双精度浮点数（至少在我的 64 位机器上）：

import numpy

single = numpy.float32(1.222) * numpy.float32(1.222)
double = numpy.float64(1.222) * numpy.float64(1.222)
pyfloat = 1.222 * 1.222

print single, double, pyfloat
# 1.49328 1.493284 1.493284

print "%.16f, %.16f, %.16f"%(single, double, pyfloat)
# 1.4932839870452881, 1.4932839999999998, 1.4932839999999998

Run Code Online (Sandbox Code Playgroud)

在交互式 Python/iPython shell 中，shell 在打印语句结果时会打印双精度结果：

>>> 1.222 * 1.222
1.4932839999999998

In [1]: 1.222 * 1.222
Out[1]: 1.4932839999999998

Run Code Online (Sandbox Code Playgroud)

右

看起来 R 在使用printand时所做的事情与 Python 相同sprintf：

print(1.222 * 1.222)
# 1.493284

sprintf("%.16f", 1.222 * 1.222)
# "1.4932839999999998"

Run Code Online (Sandbox Code Playgroud)

与交互式 Python shell 相比，交互式 R shell 在打印语句结果时也打印单精度：

> 1.222 * 1.222
[1] 1.493284

Run Code Online (Sandbox Code Playgroud)

Python 和 R 之间的区别

结果的差异可能是由于在 numpy 中使用单精度值造成的。大量加法/减法的计算最终会让问题浮出水面：

In [1]: import numpy

In [2]: a = numpy.float32(1.222)

In [3]: a*6
Out[3]: 7.3320000171661377

In [4]: a+a+a+a+a+a
Out[4]: 7.3320003

Run Code Online (Sandbox Code Playgroud)

正如您的实际问题的评论中所建议的，请确保在 numpy 计算中使用双精度浮点数。

归档时间：	9 年，7 月前
查看次数：	1878 次
最近记录：	9 年，7 月前