小编use*_*128的帖子

class arraydata//to allocate some memory, 
               //and return a pointer to that block of memory
{
    void *dataPtrV;

  public:

    double *dataPtr;

    arraydata(int a, int b)
    {
        dataPtrV=_aligned_malloc(a*b*sizeof(double),32);
        dataPtr=(double *)dataPtrV;
    }

    ~arraydata()
    {
        _aligned_free(dataPtrV);
        dataPtrV=NULL;
        dataPtr=NULL;
    }   
};

Run Code Online (Sandbox Code Playgroud)

然后叫它:

     arraydata X(30,20);

Run Code Online (Sandbox Code Playgroud)

c++ raii

use*_*128

2012 11-03

1
推荐指数

1
解决办法

437
查看次数

关于CUDA中的const指针和参数传递

nvcc如何处理内核中的const指针？

根据nvidia的说法,在参数传递过程中为指针添加const和restrict会使NVCC进行积极优化,这是否严格遵循C/C++方式？

假设A指针指向数据缓冲区,该缓冲区可能被其他线程/流频繁地更新,但在此测试内核调用期间内容不会被修改:

test<<<blocks, threads>>>(const int *__restrict__ A, int *__restrict__ B);

Run Code Online (Sandbox Code Playgroud)

然后NVCC可以保持这种正确性:在每次内核调用时加载A中的更新数据,而不是加载一些预先缓存的过时数据？

c c++ cuda nvidia

use*_*128

lucky-day

1
推荐指数

1
解决办法

1515
查看次数

__CUDA_ARCH__宏的行为

在主机代码中,__CUDA_ARCH__宏似乎不会生成不同的代码路径,相反,它将生成代码以确保当前设备的代码路径.

但是,如果__CUDA_ARCH__在设备代码中,它将为编译选项(/ arch)中指定的不同设备生成不同的代码路径.

谁能证实这是正确的？

cuda gpu nvidia

use*_*128

2013 04-18

1
推荐指数

1
解决办法

4193
查看次数

在CUDA constant内存和多GPU？

在共享内存编程模型中,每个线程都可以看到任何全局变量.

在CUDA中,常量内存以类似于共享内存系统中的全局变量的方式声明,这让我有点担心:

考虑以下代码:

__constant__ int array[1024];

void hostFunction(int DeviceID, cudaStream_t streamIdx)
{
    cudaSetDevice(DeviceID);
    someKernel<<<100,1024,0, streamIdx>>>(...);
    //The function someKernel will use data stored in array[] on current device;
};

Run Code Online (Sandbox Code Playgroud)

然后,是array[]每个cuda上下文/设备的本地内容,这样我们可以安全地更新每个设备的"私有" array[]而不用担心改变array[]其他cuda设备上分配的值吗？

顺便说一句:我搜索了网站,有一些相关的问题,但我找不到任何这些明确的答案.

c c++ arrays cuda

use*_*128

2014 02-20

1
推荐指数

1
解决办法

1016
查看次数

CUDA指针的reintepret_cast行为？

考虑以下主机功能:

uint64_t * SomeDevPtr =...
/* Where SomeDevPtr is a pointer pointed to some device memory address allocated by cudaMalloc(); */

uint32_t * SomeDevIntPtr = reintepret_cast<uint32_t *>(SomeDevPtr);

Run Code Online (Sandbox Code Playgroud)

由于该功能,cudaMalloc将automatcially fullfill一些aligment要求(我认为它对准一些128字节存储器边界),因此,我认为无论是SomeDevIntPtr和SomeDevPtr应在GPU的全局内存确切相同的物理内存地址开始,我是正确的这一？

我只是想确定一下,因为我编写的一些函数依赖于它.

c++ cuda nvidia reinterpret-cast

use*_*128

2014 02-18

0
推荐指数

1
解决办法

610
查看次数

测试数据是否属于C++中的某种数据类型？

datatype *x;//where datatype is a class defined earlier;
//...

if (isDataType(x[0]))//test whether x[0] belong to datatype defined.

//do something

Run Code Online (Sandbox Code Playgroud)

是否有任何C++功能可以像上面那样做？

c++ types runtime

use*_*128

2015 11-21

-3
推荐指数

1
解决办法

296
查看次数

标签统计

c++ ×9

c ×5

cuda ×4

nvidia ×3

gpu ×2

multithreading ×2

64-bit ×1

arrays ×1

caching ×1

gpgpu ×1

gpu-warp ×1

memory-management ×1

openmp ×1

performance ×1

raii ×1

reinterpret-cast ×1

runtime ×1

spacing ×1

types ×1

标签 统计

小编use_128的帖子

标签统计