小编use*_*567的帖子

如何在GPU上计算k个最大特征值?

我正在研究用于光谱聚类的并行算法,我需要计算K个最大特征值.我正在使用Jacket插件进行Matlab,但遗憾的是它不支持matlab中的EIGS函数(它无法计算K个特征值)并行)任何人都可以建议一些其他工具/库在GPU上完成这项任务吗?或者我还可以在GPU辅助的Matlab中做到这一点吗?

cuda eigenvalue eigenvector jacket

5
推荐指数
1
解决办法
2143
查看次数

在CUDA中初始化设备阵列

如何初始化使用分配的设备数组cudaMalloc()

我尝试了cudaMemset,但它无法初始化所有值,除了0.code,因为cudaMemset如下所示,其中value初始化为5.

cudaMemset(devPtr,value,number_bytes)
Run Code Online (Sandbox Code Playgroud)

memory-management cuda

5
推荐指数
1
解决办法
1万
查看次数

计算字典中值的频率

我的字典包含这样的值{a:3,b:9,c:88,d:3}我想计算特定数字出现在上面字典中的次数.例如上面的字典3在字典中出现两次请帮助编写python脚本

python dictionary

4
推荐指数
1
解决办法
3931
查看次数

明智地使用GPU和CPU

我是OpenCL的新手,刚开始学习.我想知道是否可以在GPU上执行少量线程并在CPU上执行剩余线程?换句话说,如果我启动100个线程并假设我有8个核心CPU,那么100个线程中的8个线程是否可能在CPU上执行,剩余的92个线程将在GPU上运行?OpenCL可以帮助我完成这项工作顺利?

opencl

4
推荐指数
1
解决办法
2703
查看次数

使用READ和WRITE构造纹理内存

我正在开发一个CUDA应用程序,其中内核必须多次访问全局内存.所有CTA随机访问此内存(没有位置,因此不能使用共享内存).我需要优化它.我听说纹理内存可以缓解这个问题,但内核可以读写纹理内存吗?1D纹理记忆?2D纹理记忆?还有CUDA阵列呢?

cuda

4
推荐指数
2
解决办法
6695
查看次数

C++ STL - 使用pair <int,string>作为数据类型的make_heap

我知道堆如何工作以及它如何安排最小和最大元素.如果vector只包含int,则很容易在STL中应用make_heap.但是make_heap()如果vector包含string和int的结构,如何应用.我希望根据int结构中的值来制作堆.请告诉我该怎么做.

c++ heap

4
推荐指数
2
解决办法
7876
查看次数

VS 2010中.cu文件中没有颜色

我正在开发简单的CUDA应用程序.我按照http://www.ademiller.com/blogs/tech/2010/10/visual-studio-2010-adding-intellisense-support-for-cuda-c/上给出的步骤进行了操作,但仍然没有颜色.cu文件.我的意思是一切都只是黑色,这可能是什么原因?我能够运行程序.

cuda visual-studio-2010

3
推荐指数
1
解决办法
2368
查看次数

偶数位置处奇数和偶数元素的奇数元素

这是在一次采访中提出的问题.请提出一些看法.给定一个包含所有正整数的数组.你必须以这样的方式排列元素,即奇数元素处于奇数位置,偶数元素处于偶数位置.

PS.没有额外的空间.O(N)解决方案

algorithm

3
推荐指数
1
解决办法
4587
查看次数

如何编译bash?

如何编译bash?我对http://ftp.gnu.org/gnu/bash/bash-4.2.tar.gz上的代码做了一些小修改.我想看看那些变化.谁能指点我编写bash的简单步骤?

linux bash

3
推荐指数
1
解决办法
8463
查看次数

Profile LLVM 通过 Clang

我想分析 LLVM 传递,即我想知道每次传递花费了多少时间。我看到 llc 有一个选项 --time-passes 来发出报告,但我如何通过 Clang 传递它?

compilation llvm clang

3
推荐指数
1
解决办法
1643
查看次数