嗨,我只是想知道是否有可能在nvidia cuda内核中执行以下操作
__global__ void compute(long *c1, long size, ...)
{
...
long d[1000];
...
}
Run Code Online (Sandbox Code Playgroud)
或以下
__global__ void compute(long *c1, long size, ...)
{
...
long d[size];
...
}
Run Code Online (Sandbox Code Playgroud) 假设给你两个恒定长度为3的整数数组,并且你总是确定给定两个arrray的两个元素将具有相同的值.
所以假设数组A有三个值:a,b,c.和数组B有三个值:d,e,f.
我们确信其中两个值是相同的.我们被要求将这四个不同的值放在大小为4的数组中,这样输出数组C应该在索引1和2中具有来自数组A和B的相同值,并且在索引0和3处它应该具有不同的值阵列A和B我实现了它,但是对这个解决方案真的不满意......有没有人有更好的解决方案?除了将我的计数器放在数组中的那个...... :)
int[] a = { 1, 201, 354 };
int[] b = { 404, 201, 354 };
int[] c = new int[4];
for (int i = 0; i < c.Length; i++)
{
Console.WriteLine(c[i]);
}
Run Code Online (Sandbox Code Playgroud) 我正在做以下事情
for i = 1:m,
index = 0;
for j = 1:n,
index = index+values(i,j)*2^(j-1);
if (j==1)
symbol_chip = chip_values(index+1,:);
else
symbol_chip = [symbol_chip chip_values(index+1,:)];
end
end
end
Run Code Online (Sandbox Code Playgroud)
它告诉我以下内容:
symbol_chip可能会在循环中成长.考虑预先分配速度.
有任何想法吗?
嗨,假设我在matlab中有以下内容
h = [0,0,0,1;
1,1,1,1];
Run Code Online (Sandbox Code Playgroud)
现在我如何打印第一个子阵列的所有值,即0,0,0,1
或者例如第二个子阵列1,1,1,1.谢谢 !
我在一台拥有四个内核的cpu的机器上运行cuda程序,如何更改cuda c程序以使用所有四个内核和所有可用的gpu?
我的意思是我的程序在gpus计算之前也在主机端执行操作'...
谢谢!