小编Jog*_*ong的帖子

为什么在CNN中使用GEMM的im2col方法比使用SIMD的方向实现方法更高效

卷积层是卷积神经网络（CNN）中计算量最大的部分。目前实现卷积层的常见方法是将图像扩展为列矩阵（im2col）并使用现有的并行通用矩阵乘法（GEMM）库。然而im2col操作需要加载和存储图像数据，并且还需要另一个内存块来保存中间数据。

如果我需要优化卷积实现，我可能会选择用SIMD指令直接实现。这种方法不会产生任何内存操作开销。

非常规律的内存访问模式所带来的好处超过了浪费的存储成本。

来自以下链接，在链接末尾

https://petewarden.com/2015/04/20/why-gemm-is-at-the-heart-of-deep-learning/

所以我希望知道原因。浮点运算可能需要更多指令周期吗？或者输入图像不太大，因此可能会残留在缓存中，并且内存操作不需要访问DDR并且消耗更少的周期。

memory floating-point instruction-set cpu-architecture conv-neural-network

Jog*_*ong

lucky-day

6
推荐指数

1
解决办法

2758
查看次数

两个三角形网格的交集

目前我正在寻找一种有效的算法来计算两个三角形网格的交集。我在网上搜索过，但没有找到有价值的材料。《实时碰撞检测》一书是一本很有帮助的书，但对于我的任务来说太复杂了。我还找到了这篇文章：Triangle to Triangle CollisionDetection in 3D。不过我希望找到有关该算法的详细描述。

问候慢跑

geometry intersection mesh

Jog*_*ong

2017 05-23

2
推荐指数

1
解决办法

3459
查看次数

均匀坐标是通过在摄像机成像中附加1的图像坐标来表示的

在相机成像中,点坐标有几个术语.

世界坐标:物理单位中的[X,Y,Z]

图像坐标:像素中的[u,v].

通过附加1,这些坐标是否成为齐次坐标？有时在书籍和纸张中它由[x,yw]表示.什么时候使用w？什么时候使用1？

在函数initUndistortRectifyMap中,http: //docs.opencv.org/2.4/modules/imgproc/doc/geometric_transformations.html#void%20initUndistortRectifyMap(InputArray%20cameraMatrix,%20InputArray%20distCoeffs,%20InputArray%20R,%20InputArray%20newCameraMatrix ,, %20Size%20size,%20int%20m1type,%20OutputArray%20map1,%20OutputArray%20map2)

应用以下过程