Java 8 hashmap高内存使用率

Lev*_*vin 8 java memory hashmap

我使用hashmap存储QTable来实现强化学习算法.我的hashmap应该存储15000000个条目.当我运行算法时,我看到进程使用的内存超过1000000K.当我计算内存时,我预计它的使用量不会超过530000K.我试着写一个例子,我得到了相同的高内存使用率:

public static void main(String[] args) {
    HashMap map = new HashMap<>(16_000_000, 1);
    for(int i = 0; i < 15_000_000; i++){
        map.put(i, i);
    }
}
Run Code Online (Sandbox Code Playgroud)

我的记忆力:

每个入口集为32字节
容量为15000000
HashMap实例使用:32*SIZE + 4*CAPACITY memory =(15000000*32 + 15000000*4)/ 1024 = 527343.75K

我的记忆计算错在哪里?

Hol*_*ger 7

好吧,在最好的情况下,我们假设字长为32位/ 4字节(使用CompressedOops和CompressedClassesPointers).然后,映射条目由两个单词JVM开销(klass指针和标记字),键,值,哈希码和下一个指针组成,总共6个字,换句话说,24个字节.因此,拥有15,000,000个条目实例将消耗360 MB.

此外,还有包含条目的数组.所述HashMap用途的能力是二的幂,所以对于15000000个条目,阵列尺寸为至少16777216,消耗64 MIB.

然后,您有30,000,000个Integer实例.问题是map.put(i, i)执行两个装箱操作,并且鼓励JVM在装箱时重用对象,但不需要这样做,并且在优化器干扰之前可能完成的简单程序中不会重复使用.

确切地说,前128个Integer实例被重用,因为对于-128 … +127范围中的值,共享是必需的,但实现通过在第一次使用时初始化整个缓存来实现,因此对于第一次128迭代,它不会创建两个实例,但缓存由256实例组成,这是实例的两倍,因此我们最终再次以30,000,000个Integer实例结束.一个Integer实例至少包含两个JVM特定字和实际int值,它们将产生12个字节,但由于默认对齐,实际消耗的内存将是16个字节,可分为8个字节.

因此,30,000,000个创建的Integer实例消耗480 MB.

这使得总共360 MB + 64 MiB + 480 MB,超过900 MB,使得1 GB的堆大小完全合理.

但这就是分析工具的用途.运行你的程序后,我得到了

使用的内存按大小排序

请注意,此工具仅报告对象的已使用大小,即对象的12个字节,Integer而不考虑在查看JVM分配的总内存时将注意到的填充.