相关疑难解决方法(0)

Cache-as-Ram(无填充模式)可执行代码

我已多次阅读有关cache-as-ram模式(无填充模式)的信息,并且想知道是否可以编写第一个可执行代码并跳转到可执行代码,如果是这样,可执行代码仅限于一级缓存的一半(从那以后)缓存真的只是sram).

architecture x86 sys

n00*_*0ax

lucky-day

8
推荐指数

1
解决办法

1573
查看次数

intel core i7处理器使用哪种缓存映射技术？

我已经了解了不同的缓存映射技术,如直接映射,关联映射和集合关联映射技术,还学习了权衡.但我很好奇现在在intel core i7或AMD处理器中使用了什么.以及这些技术是如何演变的.还有哪些事情需要改进？

x86 amd intel cpu-architecture cpu-cache

Sub*_*dip

2018 03-05

8
推荐指数

1
解决办法

2255
查看次数

使用ymm寄存器作为"类似内存"的存储位置

考虑x86中的以下循环:

; on entry, rdi has the number of iterations
.top:
; some magic happens here to calculate a result in rax
mov [array + rdi * 8], rax ; store result in output array
dec rdi
jnz .top

Run Code Online (Sandbox Code Playgroud)

它很简单:有些东西计算结果rax(未显示)然后我们将结果存储到数组中,与我们索引时的顺序相反rdi.

我想转换上面的循环而不是对内存进行任何写入(我们可以假设未显示的计算不会写入内存).

只要循环计数rdi有限,我就可以使用ymmregs 提供的充足空间(512字节)来保存值,但实际上这样做似乎很尴尬,因为你不能"索引"任意寄存器.

一种方法是始终将ymm一个元素的整个"数组" 寄存器混洗,然后将元素插入新释放的位置.

像这样的东西:

vpermq  ymm3, ymm3, 10_01_00_11b ; left rotate ymm by qword
vpermq  ymm2, ymm2, 10_01_00_11b ; left rotate ymm by qword
vpermq  ymm1, ymm1, 10_01_00_11b …

Run Code Online (Sandbox Code Playgroud)

x86 assembly sse avx

Bee*_*ope

2018 06-21

7
推荐指数

1
解决办法

398
查看次数