标签: amd-processor

OpenCV 2.0 是否针对 AMD 处理器进行了优化？

我知道过去 OpenCV 是基于 IPP 的，并且仅针对 Intel CPU 进行了优化。OpenCV 2.0 仍然是这种情况吗？

opencv x86-64 amd-processor

Sha*_*eis

2014 11-20

5
推荐指数

1
解决办法

2611
查看次数

无法运行虚拟机 - vbox amd-v

我刚收到我的新 Thinkpad E545，很想设置一个新的虚拟机进行开发。创建设备并添加 #! iso 用于安装，我尝试启动机器，但出现以下错误：

Failed to open a session for the virtual machine CrunchBang.

AMD-V is disabled in the BIOS (or by the host OS). (VERR_SVM_DISABLED).

Result Code: E_FAIL (0x80004005)
Component: Console
Interface: IConsole {8ab7c520-2442-4b66-8d74-4ff1e195d2b6}

Run Code Online (Sandbox Code Playgroud)

我做了一些搜索并找到了这个线程（https://askubuntu.com/questions/118006/amd-v-is-not-enable-in-virtualbox-in-amd-apu）并遵循了关于在我的bios，但即使重新安装后，我仍然从virtualbox得到相同的结果。在bios中启用虚拟化后，vbox中的加速选项卡仍然不可用（变灰且不可点击）。

截图：http : //i.imgur.com/ev3Ty53.png

(AMD) Android Studio Emulator 不断显示“x86 HAXM missing”错误

我找到了一个修复：

在图像部分（您选择要使用的 android 版本）中的 AVD 中创建虚拟设备时，单击其他并选择一个显示 arm64v8 或 ami 的虚拟设备。这将修复下面的错误消息并启动模拟器！

从 Android Studio 3.2 Beta 1 开始，可以在 AMD CPU 上运行 Android Emulator

我已经下载了 Android Studio 3.3 并在 Windows 功能中激活了 Hyper-V。

不过，我在 Windows 功能中找不到 Windows HyperVisor。SVM 已启用 (bios)

每当我运行模拟器的消息：

Emulator: emulator: ERROR: x86 emulation currently requires hardware acceleration! 当我尝试Intel x86 Emulator Accelator (HAXM Installer)从 Android SDK 管理器安装时，我收到以下错误（日志文件）：

=== Logging started: 24.10.2018  22:29:57 ===
This computer does not support Intel Virtualization Technology (VT-x) or it is being exclusively used by …

Run Code Online (Sandbox Code Playgroud)

android hyper-v android-emulator android-studio amd-processor

6mw*_*wlo

2020 06-27

5
推荐指数

0
解决办法

1511
查看次数

当您拥有 AMD CPU 时，可以加速使用 Intel-MKL 的代码吗？

我有一个 AMD cpu，我正在尝试运行一些使用 Intel-MKL 的代码。该代码比我预期的要慢得多。

当您拥有 AMD CPU 时，可以加速使用 Intel-MKL 的代码吗？如何？

performance cross-platform x86-64 intel-mkl amd-processor

Tre*_*ith

2021 08-27

5
推荐指数

2
解决办法

3988
查看次数

为什么现代处理器中的集缓存关联性是 8 路集关联性？

8 路设置缓存关联性是否有我看不到的特殊优势？

caching intel cpu-architecture cpu-cache amd-processor

may*_*ank

2022 06-05

5
推荐指数

1
解决办法

2239
查看次数

为什么adox 和adcx 在锐龙上不能很好地协同工作？

我花了很多时间手动优化低级整数算法，并取得了一些成功。例如，我的 6x6 乘法子程序花费了 66 个滴答声，而mpn_mul_basecase(6,6)在 Skylake 上花费了 82 个滴答声。我的代码发布在Github 上。

我目前正在为 AMD Ryzen 开发 8x8 乘法。我正在使用 Ryzen 7 3800X 进行基准测试。我努力避免延迟。我研究了 Agner Fog 的“指令表”以及 Torbjörn Granlund 的“指令延迟......”。没有任何迹象表明 Ryzen 上的 adox/adcx 存在重大问题；Ryzen 和 Skylake 在 adox/adcx 方面应该没有太大区别。我已经使用 mulx 和 adcq、adox 或 adcx 之一对乘法 8x1 子程序进行了基准测试；子程序的所有三个变体在 Skylake 和 Ryzen 上都运行得很快（18-19 个滴答声）。

但是，当我尝试将 adox 和 adcx 混合在一起时，我的代码在 Ryzen 上运行速度非常慢。例如，我的 8x2 乘法子程序在 Skylake i7-6700 上花费了 34 个滴答，在 Ryzen 7 3800X 上花费了 293 个滴答（8 倍差）。

有什么建议为什么 mulx/adox/adcx 代码在 Ryzen 上执行速度慢 …

x86 cpu-architecture gmp amd-processor adx

Ден*_*ков

2020 11-30

5
推荐指数

1
解决办法

128
查看次数

AMD：TLB 未命中周期的性能计数器

我正在寻找 AMD 特定的性能计数器，它可以在TLB发生未命中时对页面遍历所消耗的周期进行计数。我知道英特尔有这样的指标。

但是AMD上存在这种情况吗？我查看了http://developer.amd.com/wordpress/media/2013/12/56255_OSRR-1.pdf，但没有找到任何接近我需要的内容。

我还查看了perf源代码https://elixir.bootlin.com/linux/latest/source/arch/x86/events/amd/core.c#L248它似乎也没有。

也许它有不同的名字？有什么建议么？

performance tlb mmu perf amd-processor

Mar*_*ark

2023 09-26

5
推荐指数

1
解决办法

944
查看次数

缓存集大小不是 2 的幂

我有一台配备 Ryzen 7 1800X CPU 的 Linux 计算机。根据 WikiChip 的说法，它的 L2-DTLB 有 1536 个条目。所以我假设关联性可以被 3 整除。我编写了一个小程序来检查 CPUID 报告的关联性。有趣的是，它给了我 8 的关联性。为什么呢？这将给出 192 个条目的集合大小，因此没有简单的模 2 次幂索引。那么该指数是如何有效计算的呢？

那是我的程序：

#include <iostream>
#if defined(_MSC_VER)
    #include <intrin.h>
#elif defined(__GNUC__)
    #include <cpuid.h>
#endif

using namespace std;

unsigned cpuid( unsigned (&cpuidRegs)[4], unsigned code, unsigned ex );

int main()
{
    static unsigned const SHORT_WAYS[0x10] = { 0, 1, 2, 0, 4, 0, 8, 0, 16, 0, 32, 48, 64, 96, 128, (unsigned)-1 };
    unsigned regs[4];
    cpuid( regs, 0x80000006u, 0 …

Run Code Online (Sandbox Code Playgroud)

x86 cpu-architecture tlb cpuid amd-processor

Bon*_*ero

2021 11-05

5
推荐指数

1
解决办法

526
查看次数

为什么 GCP 的 AMD EPYC 虚拟机实例似乎有 1 个“有问题的”vCPU？

抱歉这篇文章太长了，这里是 TLDR：对于 Google Cloud Engine AMD 驱动的虚拟机的每个实例，1vCPU 与其他实例相比在某种程度上受到了削弱。知道如何/为什么吗？

我对 Google 计算引擎提供的各种实例类型进行了性能/价值分析，发现对于我们的工作负载，AMD EPYC Milan 驱动的n2d类型提供了最佳的性能和价值。然后我将比较扩展到其他云提供商，您可以在这里看到详细的云提供商性能/价值比较（perl 工作负载，以及编译和 Geekbench 进行良好的衡量），在此过程中，正如我试图计算诸如可扩展性之类的东西，我可以看到 Google 的 AMD EPYC 虚拟机发生了一些奇怪的情况：如果您创建了 2xvCPU、4xvCPU 或 8xvCPU（没有进一步尝试）AMD Rome ( n2d) 或 AMD Milan ( n2d, t2d, c2d) 实例，其中 1 个 vCPU与其他的不一样，有时表现会更差（取决于工作负载，甚至差 50% 以上）。2xvCPUt2d或 Rome-是一个例外n2d，在这种情况下，有时您可以获得两个 vCPU 均为“慢速”类型。

在运行单线程基准测试时，该问题表现为显着的性能差异，因为 vCPU 对于调度程序来说是相同的，因此最终由哪个 vCPU 来处理负载只是运气问题。taskset但如果用设置进程的处理器亲和力的话就很清楚了。因此，以 Geekbench 为例，其中c2dCPU 0 是我们运行的“慢”CPU：

taskset 1 ./geekbench5

Run Code Online (Sandbox Code Playgroud)

得到单核结果 986（多核在单个 vCPU 上运行 2 个线程，因此类似）。然后尝试在另一个 …

google-compute-engine google-cloud-platform amd-processor

Ecu*_*dor

2022 03-12

5
推荐指数

1
解决办法

873
查看次数

使用 OpenBLAS 构建 R

我正在尝试构建 R-devel / R-patched。我读过一些链接，与执行此操作的步骤相关。

1) https://www.r-bloggers.com/2022/01/building-r-4-2-for-windows-with-openblas/
2) https://www.r-bloggers.com/2020/05/building-r-4-for-windows-with-openblas/
3) https://github.com/r-windows/r-base

Run Code Online (Sandbox Code Playgroud)

但不幸的是，没有任何成功。

在“1”中我没有“Makefile.win”，也没有带有“-lf77blas -latlas”的文件在“2”中手动创建的“full-build.sh”脚本不执行任何操作。在“3”中我有一个错误Use_ATLAS=YES

installing 'sysdata.rda'
make[3]: *** [../../../share/make/basepkg.mk:151: sysdata] Error 127
make[2]: *** [Makefile.win:22: all] Error 2
make[1]: *** [Makefile.win:32: R] Error 1
make: *** [Makefile:18: all] Error 2

Run Code Online (Sandbox Code Playgroud)

此错误与 basepkg.mk 中的这一行有关：

@$(ECHO) "tools:::sysdata2LazyLoadDB(\"$(srcdir)/R/sysdata.rda\",\"$(top_builddir)/library/$(pkg)/R\")" | \
  R_DEFAULT_PACKAGES=NULL LC_ALL=C $(R_EXE)

Run Code Online (Sandbox Code Playgroud)

那么，有人可以帮助我吗？这3种方式有什么问题吗？如何正确构建 R devel（如果可能的话使用安装文件）？也可以使用 AMD BLIS 库来编译它（我有 Ryzen 9 5950x）。

谢谢。

PS 我使用 Windows 11 和 winlibs PPS 中的 gcc-12.02 如果可能的话，请添加使用 AMD BLIS 构建 R 的方法...

r build openblas amd-processor r-devel

Dmi*_*riy

2023 02-28

5
推荐指数

1
解决办法

1081
查看次数