标签: amd-processor

多核处理器:每个"核心"是以全时钟速度还是全时钟频率的某个部分运行?

假设你有一个(1)Intel/AMD x86-64 bit 2 GHz 8核处理器.

8个内核中的每一个都是在完整的2 GHz运行,还是每个内核运行的时间是整个2 GHz时钟的一部分(例如250 MHz)?

architecture intel microprocessors amd-processor

8
推荐指数
2
解决办法
8009
查看次数

AMD 处理器上的 Intel Vtune

我已经安装了 Intel Vtune Analyzer 9,以便从配备 AMD Turion X2 TL-58 处理器的 Windows 7 PC 上的 win32 应用程序获取调用图和计数器监控数据,但它给出错误:“CPU 架构不能正确识别后,无法收集数据”。AMD 平台有类似的工具吗?

call-graph amd-processor

8
推荐指数
2
解决办法
6402
查看次数

什么可能导致我的程序在一段时间后不使用所有核心?

我编写了一个程序,可以捕获并显示来自三个视频卡的视频.对于每一帧,我产生一个线程,将帧压缩为Jpeg,然后将其放入队列以写入磁盘.我还有其他线程从这些文件中读取并在自己的线程中解码它们.通常情况下这很好用,它是一个相当CPU密集型的程序,占所有六个CPU内核的70-80%.但过了一会儿,编码突然变慢,程序无法足够快地处理视频并开始丢帧.如果我检查CPU利用率,我可以看到一个核心(通常是核心5)不再做太多了.

发生这种情况时,如果我退出并重新启动程序并不重要.CPU 5的利用率仍然很低,程序会立即开始丢帧.删除所有已保存的视频也没有任何效果.重新启动计算机是唯一有用的.哦,如果我将我的程序的亲和力设置为使用除半空闲核心以外的所有核心,它将起作用直到另一个核心发生同样的情况.这是我的设置:

  • AMD X6 1055T(Cool&Quiet OFF)
  • GA-790FX-UD5主板
  • 4Gig RAM未组合1333Mhz'
  • Blackmagic Decklink DUO采集卡(x2)
  • Linux - Ubuntu x64 10.10,内核2.6.32.29

我的应用使用:

  • libjpeg的涡轮增压
  • posix线程
  • decklink api
  • Qt的
  • 用C/C++编写
  • 所有库都动态链接

在我看来,Linux在核心上调度线程的方式会出现某种问题.或者是否有某种方式我的程序可能会如此糟糕,以至于无法重启程序?

感谢您阅读,欢迎任何和所有输入.我被困了:)

c++ linux pthreads affinity amd-processor

8
推荐指数
1
解决办法
436
查看次数

AMD设备上的物理内存:本地与私有

我正在OpenCL中编写一个算法,我需要每个工作单元记住一部分数据,比如每个内核的a long[70]和a long[200]左右.

最近的AMD设备具有32 KiB __local内存,这是(对于每个内核的给定数据量)足以存储20-58个工作单元的信息.但是,根据我从架构中理解的内容(特别是从该图中),每个着色器核心还具有专用的私有内存量.然而,我找不到它的大小.

任何人都可以告诉我如何找出每个内核有多少私有内存?

我对HD7970特别好奇,因为我打算很快购买其中的一些.

编辑:问题解决了,答案是这里的附录D.

architecture gpu gpgpu opencl amd-processor

8
推荐指数
1
解决办法
3175
查看次数

Android 模拟器卡顿 + 工件(AMD 处理器上的 Windows 11)

系统规格:

  • 视窗11
  • AMD 锐龙 9 5900x
  • RTX 2080 TI
  • 华硕 PRIME x570 PRO 主板
  • 32GB内存

Android 模拟器极其滞后(无论选择哪个图像,我都尝试过从 API 21 到 33,并且每个图像都存在问题)。动画不流畅并且在动画时出现很多断断续续的情况(就像它们在当前状态和 1 毫秒前的前一个状态之间跳转),并且随机出现很多奇怪的黑色伪影,我什至无法使用录制功能模拟器(结果只是黑屏)

模拟器上出现黑色神器

模拟器上黑神器2

我尝试过的:

  • BIOS更新至最新版本(4403)
  • AMD处理器芯片组驱动程序更新至最新版本
  • Hyper-V、Windows Hypervisor 平台和虚拟机平台已关闭
  • 已安装适用于 AMD 的 Android 模拟器 Hypervisor(通过 Android SDK)
  • 使用模拟器图形的“硬件”
  • 重新安装Android Studio
  • 重新安装 Android 模拟器管理程序
  • Windows 没有更新
  • 运行模拟器时 GPU 使用率约为 2-3%
  • 在工具窗口或浮动窗口中运行模拟器没有效果
  • 尝试了模拟器设置中的所有渲染器(即使通过终端)
  • 编辑:未安装防病毒软件

android android-emulator android-studio amd-processor windows-11

8
推荐指数
2
解决办法
2736
查看次数

VPMASKMOVD 是否会在处理器上为屏蔽元素生成故障?

是否有处理器会VPMASKMOVD为屏蔽元素生成故障?

根据英特尔软件开发人员手册,答案显然是“否”:

故障仅由于导致故障的屏蔽位所需的存储器访问而发生。如果该存储器位置的相应掩码位为0,则不会因引用该存储器位置而发生故障。例如,如果掩码位全部为零,则不会检测到故障。

然而,AMD64 架构程序员手册第 4 卷说道:

未选择从内存加载或存储到内存的元素的异常和陷阱行为取决于实现。例如,给定的实现可能会发出数据断点或零屏蔽且未实际写入的双字的页错误信号。

是否有真正做到这一点的处理器?这是假的吗?这是怎么回事。

x86 assembly avx2 amd-processor

8
推荐指数
0
解决办法
181
查看次数

AMD 处理器上 FSIN 和其他 x87 三角指令的准确性

在 Intel 处理器上,由于使用 pi 的 66 位近似值,x87 三角指令(例如 FSIN)的精度有限,即使计算本身精确到 80 位扩展精度浮点运算的完整 64 位尾数。点值。(所有有效输入的完全准确性需要 pi 的 128 位近似值。)英特尔文档中的遗漏在问题引起注意后得到了纠正。

然而,除了《AMD64 架构程序员手册》第 1 卷中提到的内容之外,我找不到有关 AMD x87 三角指令实现准确性的类似详细信息:

6.4.5.1 超越结果的准确性

x87 计算以双扩展精度格式执行,以便超越函数为每种浮点数据类型提供精确到最后一位 (ulp)一个单位的结果。

对于所有有效输入(包括 128 位或更好的 pi 近似值),AMD 的 x87 三角指令实现实际上是否完全精确到扩展精度格式的一个 ULP 之内?与ZenZen 2架构(Ryzen 和 EPYC)相关的答案将是理想的。

floating-point trigonometry floating-accuracy x87 amd-processor

7
推荐指数
1
解决办法
778
查看次数

Zen 3 CPU 上有多少条 AMD 专有指令?

zen 3 CPU 上有多少条指令是 AMD 独有的?

我只知道3个:mwaitx, monitorx, 和clzero

另外,3DNow!和 lwp 指令集曾经是 AMD 独有的,但后来已被删除。

cpu x86 assembly instruction-set amd-processor

7
推荐指数
1
解决办法
683
查看次数

AMD DE_CFG[9] 文档

作为针对最近 zenbleed 漏洞 ( https://lock.cmpxchg8b.com/zenbleed.html ) 的缓解措施,建议设置 DE_CFG[9] = 1。

除了LFENCE 在 AMD 处理器上序列化吗?之外,我没有在该 MSR 上找到任何内容。它描述了 DE_CFG[1]。

那么设置DE_CFG[9] = 1会有什么后果呢?

security x86 cpu-architecture amd-processor

7
推荐指数
1
解决办法
774
查看次数

AMD 处理器的单步客户操作系统指令:AMD 的 Intel Monitor Trap Flag 等效项

我正在编写一个调试器,它应该跟踪虚拟机中来宾操作系统的执行情况。Intel VMX Monitor Trap Flag 字段使我们能够单步执行客户操作系统指令。

但我正在使用 AMD 处理器,并且在文档中没有找到任何等效的内容。有人知道 Intel VTX Monitor Trap Flag 是否有等效的 AMD SVM 吗?

debugging virtualization x86 intel amd-processor

6
推荐指数
0
解决办法
373
查看次数