例如,功能是:
void foo(float*,float*,int,float);
void foo(float*,float,float*,int);
Run Code Online (Sandbox Code Playgroud)
有相同或不同的开销?
编辑:我不是在询问编译器如何优化.我特别询问cdecl调用约定,各种ABI上的开销会有多大差异.
传统的调用约定几乎总是在堆栈上分配参数空间,并且总是存在与将参数复制到该空间相关的开销。
假设一个严格的易失性环境,唯一可能存在的额外开销可能是由内存对齐问题引起的。在给定的示例中,参数将位于连续的内存中,因此不会有任何填充来正确对齐。
对于具有不同大小的类型的参数,以下声明中的参数:
int func (int a, char c, int b)
Run Code Online (Sandbox Code Playgroud)
它们之间会有填充,而此声明中的填充:
int func (int a, int b, char c)
Run Code Online (Sandbox Code Playgroud)
将不会。
前者的堆栈框架可能如下所示:
| local vars... | low memory
+---------------+ - frame pointer
| a | a | a | a |
| c | X | X | X |
| b | b | b | b |
+---------------+ high memory
Run Code Online (Sandbox Code Playgroud)
对于后者:
| local vars... | low memory
+---------------+ - frame pointer
| a | a | a | a |
| b | b | b | b |
| c | X | X | X |
+---------------+ high memory
Run Code Online (Sandbox Code Playgroud)
当函数被调用时,参数将按照它们出现的顺序写入堆栈内存,因此对于前者,您将写入 的 4 个字节, 的int a1 个字节char c,然后您需要跳过这 3 个字节来写入4 个字节的int b.
在后者中,您将写入连续的内存位置,并且不需要考虑由于填充而导致的跳过。
在不稳定的环境中,我们讨论的是跳跃数纳秒量级的性能差异。性能影响可能是可察觉的,但几乎可以忽略不计。
(顺便说一句,如何跳过完全取决于体系结构......但我敢打赌,一般来说,这只是下一个要填充的地址的更高偏移量。我不完全确定这可能如何以不同的方式完成不同的架构)。
当然,在非易失性环境中,当我们利用 CPU 缓存时,性能损失会下降到几分之一纳秒。我们将冒险进入无法检测的领域,因此差异实际上是不存在的。
数据填充实际上只是空间成本。当您在嵌入式系统中工作时,您需要将参数从大到小排序,以减少(有时甚至消除)填充。
因此,据我所知(没有进一步的信息,例如特定机器或体系结构上内存之间的确切数据传输速率),不同的参数顺序不应该影响性能。
| 归档时间: |
|
| 查看次数: |
121 次 |
| 最近记录: |