我浏览了 eigen 的教程 https://eigen.tuxfamily.org/dox-devel/group__TutorialMatrixArithmetic.html
它说“注意:对于担心性能的 BLAS 用户,诸如 c.noalias() -= 2 * a.adjoint() * b; 之类的表达式已完全优化并触发单个类似 gemm 的函数调用。”
但是像 H.transpose() * H 这样的计算怎么样,因为它的结果是一个对称矩阵,所以它应该只需要正常 A*B 一半的时间,但在我的测试中, H.transpose() * H 花费与 H 相同的时间.transpose() * B. eigen对于这种情况有没有特殊的优化,像opencv一样,有类似的功能。
我知道对称优化会破坏矢量化,我只想知道特征是否有可以同时提供对称优化和矢量化的解决方案