我正在研究mips r10000的不同管道阶段.该论文称处理器每次从指令缓存中每个周期取出4条指令.但是指令缓存的延迟必须超过一个周期,但我不知道指令缓存的确切命中延迟,Haswell处理器中L1数据缓存的命中延迟大约是4个周期.
因此,如果我们假设L1指令缓存延迟是3-4个周期,那么处理器如何在每个周期中获取4个指令?
我试图用zap_pte_rangemm/memory.c 跟踪函数perf.但功能没有列在perf probe -F.那么有没有办法动态追踪这个功能?即明确添加跟踪点并重新编译内核?
perf probe -a zap_pte_range
Run Code Online (Sandbox Code Playgroud)
得到:
没有找到构建ID为33b15ec444475ee7806331034772f61666fa6719的[kernel.kallsyms],继续没有符号
无法在内核中找到符号zap_pte_range
错误:无法添加事件.