我最近阅读了很多关于软件(主要是科学/数学和加密相关)的文章,这些软件将部分计算移到GPU上,这使得支持操作的速度提高了100-1000(!)倍.
是否有库,API或其他方式通过C#在GPU上运行某些东西?我正在考虑简单的Pi计算.我有一个GeForce 8800 GTX,如果它是相关的(虽然更喜欢卡独立的解决方案).
有没有办法或工具在使用GCC编译器编译程序时应用GPU加速?现在我已经创建了一个程序来迭代地编译给定的程序列表.这需要几分钟.我知道像Pyrit这样的一些程序有助于将GPU加速应用于预计算哈希.
如果没有这样的工具,请建议是否使用OpenCL或其他任何东西来重新编程我的代码.
我正在尝试使用tensorflow nightly 2.12(以便能够使用Cuda 12.0)在GPU(NVIDIA GeForce RTX 3050)上运行一些模型。我遇到的问题是,显然我所做的每项检查似乎都是正确的,但最终脚本无法检测到 GPU。我花了很多时间试图了解正在发生的事情,但似乎没有任何效果,因此任何建议或解决方案都将受到欢迎。GPU 似乎正在为 torch 工作,正如您在问题的最后看到的那样。
我将展示我所做的一些有关 CUDA 的最常见检查(Visual Studio Code 终端),希望您发现它们有用:
检查CUDA版本:
$ nvcc --version
nvcc: NVIDIA (R) Cuda compiler driver
Copyright (c) 2005-2023 NVIDIA Corporation
Built on Fri_Jan__6_16:45:21_PST_2023
Cuda compilation tools, release 12.0, V12.0.140
Build cuda_12.0.r12.0/compiler.32267302_0
Run Code Online (Sandbox Code Playgroud)
检查与CUDA库的连接是否正确:
$ echo $LD_LIBRARY_PATH
/usr/cuda/lib
Run Code Online (Sandbox Code Playgroud)
检查 GPU …
我正在研究一个统计应用程序,它在一个数组中包含大约10-30万个浮点值.
有几种方法在嵌套循环中对数组执行不同但独立的计算,例如:
Dictionary<float, int> noOfNumbers = new Dictionary<float, int>();
for (float x = 0f; x < 100f; x += 0.0001f) {
int noOfOccurrences = 0;
foreach (float y in largeFloatingPointArray) {
if (x == y) {
noOfOccurrences++;
}
}
noOfNumbers.Add(x, noOfOccurrences);
}
Run Code Online (Sandbox Code Playgroud)
当前的应用程序是用C#编写的,在Intel CPU上运行,需要几个小时才能完成.我不了解GPU编程概念和API,所以我的问题是:
任何帮助将受到高度赞赏.
显卡是否有自己的指令集?我认为他们这样做,但我一直想知道它是否是专有的,或者是否有某种开放标准.
是每个GPU指令都先于CPU指令还是无缝的?那就是通过CPU在驱动程序层上调用OpenGL或DirectX,然后CPU向总线发送GPU指令,或者更精细.
我对与HPC计算相关的术语完全不熟悉,但我刚刚看到EC2在AWS上发布了他们的新型实例,该实例由新的Nvidia Tesla V100提供支持,它具有两种"核心":Cuda Cores(5.120),以及张量核心(640).两者有什么区别?
我需要获取有关CPU/GPU /内存的任何信息.内核数量,内存值,内存和CPU使用情况......我找到了一种方法为IE执行此操作:如何使用JavaScript查找硬件信息
我不知道的其他浏览器的解决方案.知道怎么做吗?也许webgl可以访问有关您的计算机的信息?还是闪光?或任何其他技术?
非常感谢你
我正在客户端的应用程序上发生崩溃,而不是很多WTFCrash,我没有从堆栈跟踪中得到很多用处.
我正在使用一个WKWebView实例来显示一个网页,其中包含一些基于CSS的动画和视频.问题出现在iOS 8和9上的各种设备上(iPhone 5c到6s和类似的iPad系列).
将WKWebView在其自身的进程运行,而不是应用程序的.当崩溃发生时,留下覆盖主应用程序的白色层,即使其进程未受影响,也会使其无法访问.
查看设备日志,我发现com.apple.WebKit.WebContent进程崩溃,它们都有崩溃线程完全相同的日志.
Thread 0 name: Dispatch queue: com.apple.main-thread
Thread 0 Crashed:
0 JavaScriptCore 0x0000000184c9f22c WTFCrash + 72
1 JavaScriptCore 0x0000000184c9f224 WTFCrash + 64
2 WebKit 0x0000000188ecd850 WebKit::RemoteLayerTreeDrawingArea::acceleratedAnimationDidStart(unsigned long long, WTF::String const&, double) + 0
3 WebCore 0x0000000184f2e70c WebCore::ThreadTimers::sharedTimerFiredInternal() + 148
4 WebCore 0x0000000184f2e64c WebCore::timerFired(__CFRunLoopTimer*, void*) + 36
5 CoreFoundation 0x000000018107d81c __CFRUNLOOP_IS_CALLING_OUT_TO_A_TIMER_CALLBACK_FUNCTION__ + 28
6 CoreFoundation 0x000000018107d4c0 __CFRunLoopDoTimer + 884
7 CoreFoundation 0x000000018107abd4 __CFRunLoopRun + 1520
8 CoreFoundation 0x0000000180fa4d10 …Run Code Online (Sandbox Code Playgroud) 在对光栅化和光线追踪进行了一些研究之后.我发现没有太多关于CPU如何在互联网上提供光线跟踪的信息.我偶然发现了关于皮克斯的文章,以及他们如何在CPU上预渲染汽车2.这花了他们每帧11.5小时.GPU是否会以相同的图像质量更快地渲染? http://gizmodo.com/5813587/12500-cpu-cores-were-required-to-render-cars-2 https://www.engadget.com/2014/10/18/disney-big-hero-6/ http://www.firstshowing.net/2009/michael-bay-presents-transformers-2-facts-and-figures/ 干杯,萨姆
gpu ×10
cpu ×2
cuda ×2
.net ×1
api ×1
c ×1
c# ×1
c++ ×1
css ×1
gcc ×1
hardware ×1
ios ×1
javascript ×1
memory ×1
monitoring ×1
nvidia ×1
python ×1
rasterizing ×1
raytracing ×1
tensorflow ×1
webgl ×1
webkit ×1
wkwebview ×1