我知道过去 OpenCV 是基于 IPP 的,并且仅针对 Intel CPU 进行了优化。OpenCV 2.0 仍然是这种情况吗?
我刚收到我的新 Thinkpad E545,很想设置一个新的虚拟机进行开发。创建设备并添加 #! iso 用于安装,我尝试启动机器,但出现以下错误:
Failed to open a session for the virtual machine CrunchBang.
AMD-V is disabled in the BIOS (or by the host OS). (VERR_SVM_DISABLED).
Result Code: E_FAIL (0x80004005)
Component: Console
Interface: IConsole {8ab7c520-2442-4b66-8d74-4ff1e195d2b6}
Run Code Online (Sandbox Code Playgroud)
我做了一些搜索并找到了这个线程(https://askubuntu.com/questions/118006/amd-v-is-not-enable-in-virtualbox-in-amd-apu)并遵循了关于在我的bios,但即使重新安装后,我仍然从virtualbox得到相同的结果。在bios中启用虚拟化后,vbox中的加速选项卡仍然不可用(变灰且不可点击)。
截图:http : //i.imgur.com/ev3Ty53.png
相关笔记本电脑规格:
Processor AMD A10-5750M Accelerated Processor (2.5GHz to 3.5GHz, 4MB Cache, 1600MHz) with Radeon HD 8650G Graphics
Operating System Windows 8 64
Operating System Language Windows 8 64 English
Display 15.6W HD AntiGlare, Midnight Black
Graphics …Run Code Online (Sandbox Code Playgroud) 我找到了一个修复:
在图像部分(您选择要使用的 android 版本)中的 AVD 中创建虚拟设备时,单击其他并选择一个显示 arm64v8 或 ami 的虚拟设备。这将修复下面的错误消息并启动模拟器!
从 Android Studio 3.2 Beta 1 开始,可以在 AMD CPU 上运行 Android Emulator
我已经下载了 Android Studio 3.3 并在 Windows 功能中激活了 Hyper-V。
不过,我在 Windows 功能中找不到 Windows HyperVisor。SVM 已启用 (bios)
每当我运行模拟器的消息:
Emulator: emulator: ERROR: x86 emulation currently requires hardware acceleration!
当我尝试Intel x86 Emulator Accelator (HAXM Installer)从 Android SDK 管理器安装时,我收到以下错误(日志文件):
=== Logging started: 24.10.2018 22:29:57 ===
This computer does not support Intel Virtualization Technology (VT-x) or it is being exclusively used by …Run Code Online (Sandbox Code Playgroud) android hyper-v android-emulator android-studio amd-processor
我有一个 AMD cpu,我正在尝试运行一些使用 Intel-MKL 的代码。该代码比我预期的要慢得多。
8 路设置缓存关联性是否有我看不到的特殊优势?
我花了很多时间手动优化低级整数算法,并取得了一些成功。例如,我的 6x6 乘法子程序花费了 66 个滴答声,而mpn_mul_basecase(6,6)在 Skylake 上花费了 82 个滴答声。我的代码发布在Github 上。
我目前正在为 AMD Ryzen 开发 8x8 乘法。我正在使用 Ryzen 7 3800X 进行基准测试。我努力避免延迟。我研究了 Agner Fog 的“指令表”以及 Torbjörn Granlund 的“指令延迟......”。没有任何迹象表明 Ryzen 上的 adox/adcx 存在重大问题;Ryzen 和 Skylake 在 adox/adcx 方面应该没有太大区别。我已经使用 mulx 和 adcq、adox 或 adcx 之一对乘法 8x1 子程序进行了基准测试;子程序的所有三个变体在 Skylake 和 Ryzen 上都运行得很快(18-19 个滴答声)。
但是,当我尝试将 adox 和 adcx 混合在一起时,我的代码在 Ryzen 上运行速度非常慢。例如,我的 8x2 乘法子程序在 Skylake i7-6700 上花费了 34 个滴答,在 Ryzen 7 3800X 上花费了 293 个滴答(8 倍差)。
有什么建议为什么 mulx/adox/adcx 代码在 Ryzen 上执行速度慢 …
我正在寻找 AMD 特定的性能计数器,它可以在TLB发生未命中时对页面遍历所消耗的周期进行计数。我知道英特尔有这样的指标。
但是AMD上存在这种情况吗?我查看了http://developer.amd.com/wordpress/media/2013/12/56255_OSRR-1.pdf,但没有找到任何接近我需要的内容。
我还查看了perf源代码https://elixir.bootlin.com/linux/latest/source/arch/x86/events/amd/core.c#L248它似乎也没有。
也许它有不同的名字?有什么建议么?
我有一台配备 Ryzen 7 1800X CPU 的 Linux 计算机。根据 WikiChip 的说法,它的 L2-DTLB 有 1536 个条目。所以我假设关联性可以被 3 整除。我编写了一个小程序来检查 CPUID 报告的关联性。有趣的是,它给了我 8 的关联性。为什么呢?这将给出 192 个条目的集合大小,因此没有简单的模 2 次幂索引。那么该指数是如何有效计算的呢?
那是我的程序:
#include <iostream>
#if defined(_MSC_VER)
#include <intrin.h>
#elif defined(__GNUC__)
#include <cpuid.h>
#endif
using namespace std;
unsigned cpuid( unsigned (&cpuidRegs)[4], unsigned code, unsigned ex );
int main()
{
static unsigned const SHORT_WAYS[0x10] = { 0, 1, 2, 0, 4, 0, 8, 0, 16, 0, 32, 48, 64, 96, 128, (unsigned)-1 };
unsigned regs[4];
cpuid( regs, 0x80000006u, 0 …Run Code Online (Sandbox Code Playgroud) 抱歉这篇文章太长了,这里是 TLDR:对于 Google Cloud Engine AMD 驱动的虚拟机的每个实例,1vCPU 与其他实例相比在某种程度上受到了削弱。知道如何/为什么吗?
我对 Google 计算引擎提供的各种实例类型进行了性能/价值分析,发现对于我们的工作负载,AMD EPYC Milan 驱动的n2d类型提供了最佳的性能和价值。然后我将比较扩展到其他云提供商,您可以在这里看到详细的云提供商性能/价值比较(perl 工作负载,以及编译和 Geekbench 进行良好的衡量),在此过程中,正如我试图计算诸如可扩展性之类的东西,我可以看到 Google 的 AMD EPYC 虚拟机发生了一些奇怪的情况:如果您创建了 2xvCPU、4xvCPU 或 8xvCPU(没有进一步尝试)AMD Rome ( n2d) 或 AMD Milan ( n2d, t2d, c2d) 实例,其中 1 个 vCPU与其他的不一样,有时表现会更差(取决于工作负载,甚至差 50% 以上)。2xvCPUt2d或 Rome-是一个例外n2d,在这种情况下,有时您可以获得两个 vCPU 均为“慢速”类型。
在运行单线程基准测试时,该问题表现为显着的性能差异,因为 vCPU 对于调度程序来说是相同的,因此最终由哪个 vCPU 来处理负载只是运气问题。taskset但如果用设置进程的处理器亲和力的话就很清楚了。因此,以 Geekbench 为例,其中c2dCPU 0 是我们运行的“慢”CPU:
taskset 1 ./geekbench5
Run Code Online (Sandbox Code Playgroud)
得到单核结果 986(多核在单个 vCPU 上运行 2 个线程,因此类似)。然后尝试在另一个 …
我正在尝试构建 R-devel / R-patched。我读过一些链接,与执行此操作的步骤相关。
1) https://www.r-bloggers.com/2022/01/building-r-4-2-for-windows-with-openblas/
2) https://www.r-bloggers.com/2020/05/building-r-4-for-windows-with-openblas/
3) https://github.com/r-windows/r-base
Run Code Online (Sandbox Code Playgroud)
但不幸的是,没有任何成功。
在“1”中我没有“Makefile.win”,也没有带有“-lf77blas -latlas”的文件在“2”中手动创建的“full-build.sh”脚本不执行任何操作。在“3”中我有一个错误Use_ATLAS=YES
installing 'sysdata.rda'
make[3]: *** [../../../share/make/basepkg.mk:151: sysdata] Error 127
make[2]: *** [Makefile.win:22: all] Error 2
make[1]: *** [Makefile.win:32: R] Error 1
make: *** [Makefile:18: all] Error 2
Run Code Online (Sandbox Code Playgroud)
此错误与 basepkg.mk 中的这一行有关:
@$(ECHO) "tools:::sysdata2LazyLoadDB(\"$(srcdir)/R/sysdata.rda\",\"$(top_builddir)/library/$(pkg)/R\")" | \
R_DEFAULT_PACKAGES=NULL LC_ALL=C $(R_EXE)
Run Code Online (Sandbox Code Playgroud)
那么,有人可以帮助我吗?这3种方式有什么问题吗?如何正确构建 R devel(如果可能的话使用安装文件)?也可以使用 AMD BLIS 库来编译它(我有 Ryzen 9 5950x)。
谢谢。
PS 我使用 Windows 11 和 winlibs PPS 中的 gcc-12.02 如果可能的话,请添加使用 AMD BLIS 构建 R 的方法...