标签: compute-shader

着色器中的DirectX着色器资源视图

我现在有点困惑,只是想请大家帮我弄清楚一些想法.

在HLSL着色器(例如计算着色器)中,我可以声明StructuredBuffer sb,对吗？我是否必须将其绑定到寄存器,例如:register(t0)？

从应用程序端,我可以调用CSSetShaderResources(...).第一个参数(StartSlot),是否与寄存器声明中"t"后面的小数字有关？

如果我将StartSlot设置为0(例如),并将第二个参数设置为2.我告诉API我将绑定两个着色器资源视图,一个在寄存器(t0)中,另一个在寄存器中(t1)？

如果我声明Texture2D tex [10]:register(t0)我可以通过调用CSSetShaderResources(0,10,...)来设置它.这是否意味着寄存器(t0~t9)都用完了？

对于这样一个问题的"快速解雇"感到抱歉,但我真的很困惑,我的一些测试似乎给出了令人难以置信的结果......

任何帮助,将不胜感激.

c++ directx shader hlsl compute-shader

l3u*_*fly

lucky-day

7
推荐指数

1
解决办法

4642
查看次数

如何将HTML5 Canvas用作WebGL纹理

我想要:

为案例i设置统一值.
将案例i的计算着色器渲染为HTML5 <canvas>标记.
<canvas>在下一个渲染过程中使用内容(情况我渲染输出)作为纹理.
对所有情况重复.
从颜色数据中将答案提取到JS中.

我正在尝试制作计算着色器,并且需要在每个渲染过程中携带每像素值(片段).一个简单的例子是在每次渲染调用时递增像素的蓝色值.

即

pass 1: b=1
pass 2: b=2
pass 2: b=3
etc.

Run Code Online (Sandbox Code Playgroud)

这种着色器循环甚至可能吗？
有没有更好的方法在视频存储器中保持"进位"纹理以进行多通道处理(与标准着色器内多路处理不同,均匀值必须在通道之间改变)？

textures canvas webgl compute-shader

Adr*_*ley

lucky-day

7
推荐指数

1
解决办法

7274
查看次数

DirectCompute原子计数器

在计算着色器(使用Unity)中,我有一个光线投影查找与网格三角形的交叉点.在某些时候,我想返回找到多少个十字路口.

我可以通过标记像素清楚地看到有多少个交叉点,但是如果我只是为计算着色器中的每个交集增加一个全局int(并通过缓冲区返回),那么我得到的数字就没有意义了.我认为这是因为我正在制造竞争条件.

我看到opengl有"原子计数器":https://www.opengl.org/wiki/Atomic_Counter,这看起来就像我在这种情况下需要的那样.我没有在Unity和DirectCompute文档中找到这样的功能.有没有办法做到这一点？

我可以创建一个appendBuffer,但它看起来很傻,因为我确实只需要返回一个int.

unity-game-engine compute-shader directcompute

Aar*_*ski

lucky-day

7
推荐指数

1
解决办法

2241
查看次数

DirectX11:将数据从ComputeShader传递给VertexShader？

是否可以将滤镜应用于要使用Compute Shader渲染的几何数据,然后将结果用作顶点着色器中的输入缓冲区？这样可以省去回读数据的麻烦(和时间).

任何帮助深表感谢.

directx directx-11 slimdx compute-shader vertex-shader

tes*_*ino

2010 10-30

6
推荐指数

1
解决办法

1389
查看次数

OpenGL Compute Shader Invocations

我得到了一个与新计算着色器相关的问题.我目前正在研究粒子系统.我将所有粒子存储在着色器存储缓冲区中,以便在计算着色器中访问它们.然后我派遣一个一维工作组.

#define WORK_GROUP_SIZE 128
_shaderManager->useProgram("computeProg");
glDispatchCompute((_numParticles/WORK_GROUP_SIZE), 1, 1);
glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT);

Run Code Online (Sandbox Code Playgroud)

我的计算着色器:

#version 430
struct particle{
         vec4 currentPos;
         vec4 oldPos;
};

layout(std430, binding=0) buffer particles{
         struct particle p[];
};

layout (local_size_x = 128, local_size_y = 1, local_size_z = 1) in;
void main(){
         uint gid = gl_GlobalInvocationID.x;

         p[gid].currentPos.x += 100;
}

Run Code Online (Sandbox Code Playgroud)

但不知何故并非所有粒子都受到影响.我这样做就像在这个例子中一样,但它不起作用.http://education.siggraph.org/media/conference/S2012_Materials/ComputeShader_6pp.pdf

编辑:

在我调用glMemoryBarrier(GL_SHADER_STORAGE_BARRIER_BIT)后,我继续这样:

_shaderManager->useProgram("shaderProg"); 
glBindBuffer(GL_ARRAY_BUFFER, shaderStorageBufferID); 
glVertexPointer(4,GL_FLOAT,sizeof(glm::vec4), (void*)0);
glEnableClientState(GL_VERTEX_ARRAY); 
glDrawArrays(GL_POINTS, 0, _numParticles); 
glDisableClientState(GL_VERTEX_ARRAY);

Run Code Online (Sandbox Code Playgroud)

那么在这种情况下哪个位适合使用？

c++ opengl gpgpu compute-shader

Sta*_*tan

2012 10-06

6
推荐指数

2
解决办法

5175
查看次数

DirectCompute最佳numthreads设置

我最近一直在使用计算着色器,我正在尝试确定设置[numthreads(x,y,z)]和调度调用的最佳方法.我的演示窗口是800x600,我每像素启动1个线程.我正在进行2D纹理修改 - 没有太重.

我的第一次尝试是指定

[numthreads(32,32,1)]

Run Code Online (Sandbox Code Playgroud)

我的Dispatch()调用总是如此

Dispatch(ceil(screenWidth/numThreads.x),ceil(screenHeight/numThreads.y),1)

Run Code Online (Sandbox Code Playgroud)

因此,对于第一个实例

Dispatch(25,19,1)

Run Code Online (Sandbox Code Playgroud)

这个速度为25-26 fps.然后我减少到[numthreads(4,4,1)],运行速度为16 fps.将它增加到[numthreads(16,16,1)]开始了大约30 fps的良好结果.使用Y线程组编号[numthreads(16,8,1)]进行操作,设法将其推送到32 fps.

我的问题是有没有一种最佳的方法来确定线程数,这样我可以最有效地利用GPU,或者只是好的试验和错误？

directx direct3d directx-11 compute-shader directcompute

Val*_*tin

2013 10-24

6
推荐指数

1
解决办法

2587
查看次数

在OpenGL中渲染数据:顶点和计算着色器

我希望能够将一堆顶点输入到我的图形程序中,然后我希望能够对它们执行以下操作:

在OpenGL的图形部分中使用它们,尤其是在顶点着色器中.
在Compute Shader中对它们进行物理计算.

根据这些要求,我认为我需要一些结构来存储我的顶点并且可以正确访问它们,我想到了以下内容:

ArrayBuffers
纹理(如存储信息,而不是纹理本身)

然而,我已经想到并提出了两种变体的缺点:

ArrayBuffers:

我不确定我的Compute Shader如何读取,更不用说修改顶点了.但我确实知道如何绘制它们.

纹理:

我知道如何在Compute Shaders中修改它们,但我不确定如何从纹理中绘制.更具体地,需要绘制的元素的数量取决于纹理中的写入(数据非零)元素的数量.

我可能忽略了一些满足我需要的重要其他功能,因此真正的问题是:
如何创建驻留在GPU上的顶点以及我可以在顶点和计算着色器中访问哪些？

opengl graphics shader compute-shader vertex-shader

ski*_*iwi

lucky-day

6
推荐指数

1
解决办法

3510
查看次数

计算着色器写入纹理

我已经实现了CPU代码,可以将投影纹理复制到3d对象上的更大纹理,如果愿意,可以"贴花烘焙",但现在我需要在GPU上实现它.为此,我希望使用计算着色器,因为在我当前的设置中添加FBO非常困难.

我当前实现的示例图像

这个问题更多的是关于如何使用Compute着色器,但对于任何感兴趣的人,这个想法是基于我从用户jozxyqk得到的答案,在这里看到:https://stackoverflow.com/a/27124029/2579996

写入的纹理在我的代码中被调用_texture,而投影的纹理是_textureProj

简单的计算着色器

const char *csSrc[] = {
    "#version 440\n",
    "layout (binding = 0, rgba32f) uniform image2D destTex;\
     layout (local_size_x = 16, local_size_y = 16) in;\
     void main() {\
           ivec2 storePos = ivec2(gl_GlobalInvocationID.xy);\
           imageStore(destTex, storePos, vec4(0.0,0.0,1.0,1.0));\
    }"
};

Run Code Online (Sandbox Code Playgroud)

如您所见,我目前只想将纹理更新为某种任意(蓝色)颜色.

更新功能

void updateTex(){ 
    glUseProgram(_computeShader);
    const GLint location = glGetUniformLocation(_computeShader, "destTex"); 
    if (location == -1){
        printf("Could not locate uniform location for texture in CS");
    }
    // bind texture
    glUniform1i(location, 0); 
    glBindImageTexture(0, *_texture, 0, GL_FALSE, 0, …

Run Code Online (Sandbox Code Playgroud)

opengl glsl compute-shader map-projections

mik*_*ike

2017 05-23

6
推荐指数

1
解决办法

4657
查看次数