将数据从 hdf5 数据集传输到 numpy 数组时精度损失

Question

将数据从 hdf5 数据集传输到 numpy 数组时精度损失

bil*_*ert 5 python precision numpy hdf5

我试图将数据从 hdf5 数据集（f_one，在下面的屏幕截图中）复制到一个 numpy 数组中，但我发现我失去了一些精度。

屏幕截图的最后一行（最后一个打印语句）应为

subid2[0] == subid2[1] .

我只是在截取屏幕截图之前不小心删除了 2。输出是正确的。

如您所见，Python 似乎认为这两个数字完全相同——但是，当这两个数字包含在一个 numpy 数组中时，我需要精度来区分这两个数字。有谁知道我如何获得这种精度？简而言之，我怎样才能让最后一个打印语句产生 False？

顺便说一下，以下内容：

    f_one['SubhaloID'][0] == f_one['SubhaloID'][1]

Run Code Online (Sandbox Code Playgroud)

产生False。因此，在复制到 numpy 数组时会丢失一些精度。

Answer 1

小智 4

问题是您的输入是整数类型，但是当创建 numpy 数组而不指定数据类型时，您最终会默认将它们转换为浮点数。为了避免这种情况，请dtype=np.int64在为此数据创建 numpy 数组时使用。另一种选择是直接转换现有的整数数组，因此其条目的类型被继承。

这是一个简化的示例。

import numpy as np
a = [30000000200000000, 30000000200000001]
print(a[0]==a[1])           # False 
b = np.array(a)
print(b[0]==b[1])           # False, direct conversion still has integers 
c = np.array([])
for i in range(2):
    c = np.append(c, a[i])
print(c[0]==c[1])           # True, the entries are now floats
d = np.array([], dtype=np.int64)
for i in range(2):
    d = np.append(d, a[i])
print(d[0]==d[1])           # False, the entries were declared as integers

Run Code Online (Sandbox Code Playgroud)

type(c[0])使用和检查类型type(d[0])以查看差异。

归档时间：	9 年，6 月前
查看次数：	344 次
最近记录：	9 年，6 月前