相关疑难解决方法(0)

perf报告显示此函数"__memset_avx2_unaligned_erms"有开销.这是否意味着内存未对齐?

我试图使用perf工具来分析我的C++代码.实现包含带有SSE/AVX/AVX2指令的代码.除了该代码使用-O3 -mavx2 -march=native标志编译.我相信__memset_avx2_unaligned_erms函数是一个libc实现memset.perf表明这个功能有相当大的开销.函数名称表示内存未对齐,但在代码中我使用GCC内置宏显式对齐内存__attribute__((aligned (x)))可能是此函数有明显开销的原因以及为什么虽然内存明确对齐但调用了未对齐版本?

我已将样本报告附在图片上.在此输入图像描述

c++ profiling avx avx2 perf

1
推荐指数
1
解决办法
906
查看次数

标签 统计

avx ×1

avx2 ×1

c++ ×1

perf ×1

profiling ×1