如果我们有一个神经网络,例如使用sigmodial逻辑激活函数的多层感知器反向传播神经网络,是否可以提供网络输出并让它计算出一组输入?由于我们可以通过使用自然对数和逆运算来反转激活函数,直到我们得到一个由所有权重乘以其输入组成的和值,我认为至少可以得到一组可能的输入将生成指定的输出值.
我目前有一大堆浮点数,我在我的OpenCL内核中处理我想知道我是否将这个数组分开并使用OpenCL矢量类型数组,如果它会加快进程.基本上如果我有一个4,800个浮点数组,我会把它分成300个float16向量的数组.这会利用SIMD吗?
我有一些OpenCL内核没有做他们应该做的事情,我很想在Xcode中调试它们.这可能吗?
如果没有,有什么方法可以printf()在我的基于CPU的内核中使用?当我printf()在我的内核中使用时,OpenCL编译器总是给我一大堆错误.
我对装配很新,虽然手臂信息中心经常有用,但有时说明对新手来说有点混乱.基本上我需要做的是在四字寄存器中求和4个浮点值并将结果存储在单个精度寄存器中.我认为指令VPADD可以做我需要的但我不太确定.
根据手臂信息中心,当我尝试时,vadd可以顺便执行
vaddeq.f32 d0,d0,d1
Run Code Online (Sandbox Code Playgroud)
Xcode返回
65:instruction cannot be conditional -- vaddeq.f32 d0,d0,d1
Run Code Online (Sandbox Code Playgroud)
我注意到的一件事是它似乎只是NEON指令给出了这个错误.VFP指令不会产生这些错误.
我是否需要设置编译器标志才能启用NEON条件指令?