在for循环比较中使用集合大小

Question

Java中的Collections的size()方法是否有编译器优化？

请考虑以下代码:

for(int i=0;i<list.size();i++)
      ...some operation.....

每个i都调用size()方法.找出尺寸并重复使用它不是更好吗？(方法调用有开销).

final int len = list.size()
for(int i=0;i<len;i++)
      ...some operation.....

然而,当我为这两个代码片段计时时,没有显着的时间差异,即使我高达10000000.我在这里错过了一些东西吗？

Update1:我知道除非集合发生变化,否则不再计算大小.但是必须有一些与方法调用相关的开销.编译器是否总是内联这些(参见Esko的答案)？

更新2:我的好奇心得到了进一步的推动.从给出的答案中,我看到好的JIT编译器经常会内联这个函数调用.但他们仍然需要确定该集合是否被修改.我不接受答案,希望有人能给我指点如何由编译器处理.

Answer 1

好的,这里是JDK源代码的摘录(JDK文件夹中的src.zip):

public int size() {
    return size;
}

这是来自ArrayList,但我认为其他集合具有类似的实现.现在,如果我们想象编译器内联size()调用(这将是完全合理的),你的循环变为:

for(int i=0;i<list.size;i++)
// ...

(好吧,让我们忘记大小是私有的.)编译器如何检查集合是否被修改？答案是它没有也不需要这样做,因为该字段已经在字段中可用,所以它所要做的就是在每次迭代时访问size字段,但访问int变量非常快操作.请注意,它可能只计算一次地址,因此它甚至不必在每次迭代时取消引用列表.

例如,通过add()方法修改集合会发生什么？

public boolean add(E e) {
    ensureCapacity(size + 1);  // Increments modCount!!
    elementData[size++] = e;
    return true;
}

如您所见,它只会增加大小字段.因此编译器实际上不需要做任何事情来确保它可以访问最新的大小.唯一的例外是,如果从另一个线程修改集合,则需要进行同步,否则循环线程可能会看到其本地缓存的大小值,可能会也可能不会更新.

Answer 2

collection的.size()方法返回的值通常仅在修改实际集合时添加并重新计算(添加新元素或删除旧元素).

不要比较for循环控制范围,而是尝试使用for each循环,因为实际上使用的循环Iterator在某些集合实现中比使用索引迭代要快得多.