与单个进程方案相比,多进程方案中的访问时间意外较低

bho*_*ath 4 c performance gcc cpu-architecture performance-testing

我从program1访问共享库(共享数组数据结构),并找到读取该数组的所有元素的访问时间.我得到大约17000个滴答,而只有Program1单独执行.

现在,当我首先在另一个选项卡中执行program2(具有空的while循环以保持终止)时,然后运行program1并测量访问时间以读取该数组的所有元素.令我惊讶的是,与之前只有Program1执行的场景相比,我获得了8000ticks.

看起来只有program1执行时才需要花费更多时间来读取数组,而有2个程序时,program1正在执行与之前相同的任务,而program2通过while循环使CPU保持忙碌状态.预计存在program1的访问时间会更长,而实际结果则相反.

为什么会这样?

这是共享库

#include <stdio.h> 
static const int DATA[1024]={1 ,2 ,3,.....1024];
inline void foo(void)
{
    int j, k=0,count=0;

    for(j=0;j<1024;j++)
      {
        k=DATA[j];
      }

    k+=0;    
}
Run Code Online (Sandbox Code Playgroud)

PROGRAM1

   int main(void)
    {    
    foo();

    start=timer();
    foo();
    end=timer();
    printf("Time1=%llu\n",end-start);    

    start=timer();
    foo();
    end=timer();
    printf("Time2=%llu\n",end-start);    


    start=timer();
    foo();
    end=timer();
    printf("Time3=%llu\n",end-start); 
    sleep(1);

    start=timer();
    foo();
    end=timer();
    printf("after sleep(1)\n");
    printf("Time4=%llu\n",end-start);    

    start=timer();
    foo();
    end=timer();
    printf("Time5=%llu\n",end-start);    

    sleep(2); 
    start=timer();
    foo();
    end=timer();
    printf("after sleep(2)\n");
    printf("Time6=%llu\n",end-start);    

    return 0;
    }
Run Code Online (Sandbox Code Playgroud)

程序2

   int main(void)
    {
    while(1)
        {}        
    return 0;
    }
Run Code Online (Sandbox Code Playgroud)

CASE1(仅运行Program1)

产量

Time1=17918
Time2=17672  
Time3=17816  

after sleep(1)
**Time4= 20716 ** // Is it due to wake up from sleep mode ?
Time5=17722

after sleep(2)
**Time6=20910** // Is it due to wake up from sleep mode ?
Run Code Online (Sandbox Code Playgroud)

CASE1(程序2首先运行,然后程序1开始运行)

产量

Time1 =7483  
Time2=7205
Time3=7399

after sleep(1)
**Time4= 8734 ** // Is it due to wake up from sleep mode ?
Time5=7326

after sleep(2)
**Time6=9070** // Is it due to wake up from sleep mode ?
Run Code Online (Sandbox Code Playgroud)

据我所知,当program1单独使用CPU时,读取数组所需的时间必须少于Program1和program2使用CPU时的时间.

我在哪里犯错误?我有i7机器,只有一个核心,超线程被禁用,ASLR被禁用.

编辑1:

根据Mysticial的建议,我的CPU进入省电模式,而只有program1在那里,所以CPU进入省电模式,然后从省电模式唤醒它需要更长的访问时间.所以他的建议是多次访问DATA数组.

这是我修改过的共享库.Program1和Program2没有改变.

#include <stdio.h> 
static const int DATA[1024]={1 ,2 ,3,.....1024];
inline void foo(void)
{
    int j, k=0,count=0;
  while(count++<10000)
  {  
    for(j=0;j<1024;j++)
      {
        k=DATA[j];
      }
   }  
    k+=0;    
}
Run Code Online (Sandbox Code Playgroud)

现在输出如下

CASE1(仅运行Program1)

产量

Time1=75186246
Time2=77570299 
Time3=80548529 

after sleep(1)
**Time4= 92608363 ** // Is it due to wake up from sleep mode ?
Time5=75616487

after sleep(2)
**Time6=97021338** // Is it due to wake up from sleep mode ?
Run Code Online (Sandbox Code Playgroud)

CASE1(程序2首先运行,然后程序1开始运行)

产量

Time1 =139337099 
Time2=155801957
Time3=146586856

after sleep(1)
**Time4= 130558062 ** // Why lower access time after sleep mode ?
Time5=145250551 // Time5 is expected lower than Time4 as other run . Why lower here ?

after sleep(2)
**Time6=130940183** // Again Why lower access time after sleep mode ?
Run Code Online (Sandbox Code Playgroud)

以下是有关修改后的共享库的新问题

  1. 当没有程序2时,则在睡眠访问时间(t4/t6) 与先前访问时间(t3/t5,进入睡眠之前)相比更高.我可以说,这是由于Mysticial所解释的从睡眠中唤醒CPU的原因吗?

  2. 现在,当program2在另一个选项卡中运行时,睡眠访问时间(t4/t6) 与之前的访问时间(t3/t5,进入睡眠状态)相比较低.我q(1)和q(2)的原因是矛盾的.从睡眠中醒来后获得较低访问时间的原因是什么(t4 <t3)?虽然我在睡眠后获得更高的访问时间,但没有多次访问DATA数组(原始共享库).

  3. 为什么t2<t1 and t3<t2不保持为true,因为共享库已经加载到内存和缓存中.这是由于PAGE SWAPPING吗?

我在linux下使用gcc.任何帮助理解这一点将受到高度赞赏.提前致谢.

Mys*_*ial 5

这是我的推测性答案,似乎已在评论中得到证实:

在原始基准测试中,您只运行一次迭代.因此,基准测试的运行时间不足以"平均"所有随机性.

当您自己运行program1时,它需要将CPU从节能状态唤醒.这需要时间并且可能导致运行时间更长.

当您同时运行两个程序时(首先从program2开始),program2会提前将CPU从节能状态中拉出来.因此,当您运行program1时,不会实现此预热惩罚.


一旦你循环基准测试需要更长的时间,这个预热惩罚变得微不足道,你终于看到了代码的预期稳态性能.(program1本身更快)