GPU上的iPhone大型矩阵乘法

Ale*_*ree 4 iphone gpu linear-algebra gpu-programming matrix-multiplication

我已经设计了一个用于iPad游戏的学习AI,但它的原型是用matlab编写的.我需要执行以下几个操作:(大写表示矩阵)

A = B > c;
A = B * C;
A = B' * C;
A = B .* C;
A = B - C;
Run Code Online (Sandbox Code Playgroud)

我的一些矩阵很大(2601 x 100).在GPU上运行这些操作可以显着提高此操作的性能.是否有一个线性代数库比Accelerate的BLAS更合适?BLAS仅支持最多4x4矩阵.

Kay*_*Kay 5

我们在使用(开源)Eigen库的前项目中取得了相当不错的成绩.

  • 它是一个仅包含头文件的C++模板库,但这不是问题,因为您可以使用普通C或Objective-C++(.mm)编写接口.
  • 它的代码针对armv7进行了大量优化.
  • LGPL3许可模式应该是在app-store上发布应用程序而不会干扰Apple的TOS的不错选择.