Julia矩阵乘法比numpy慢

Lui*_*eis 1 python numpy blas matrix-multiplication julia

我试图在Julia中进行一些矩阵乘法,以便将其与numpy进行对比.

我的Julia代码如下:

function myFunc()
  A = randn(10000, 10000)
  B = randn(10000, 10000)
  return A*B
end

myFunc()
Run Code Online (Sandbox Code Playgroud)

而python版本是:

A = np.random.rand(10000,10000)
B = np.random.rand(10000,10000)
A*B
Run Code Online (Sandbox Code Playgroud)

Python版本需要不到100毫秒才能执行.Julia版本需要超过13秒!看到他们在引擎盖下使用几乎相同的BLAS技术,似乎是Julia版本的问题?!

sen*_*rle 12

我不认为那些做同样的事情.的numpy表达只是做一个元件逐元素乘法,而朱莉娅表达确实真矩阵乘法.

您可以通过使用较小的输入来查看差异.这是一个numpy例子:

>>> A
array([1, 2, 3])
>>> B
array([[1],
       [2],
       [3]])
>>> A * B
array([[1, 2, 3],
       [2, 4, 6],
       [3, 6, 9]])
>>> B * A
array([[1, 2, 3],
       [2, 4, 6],
       [3, 6, 9]])
Run Code Online (Sandbox Code Playgroud)

请注意,这里我们有广播,它"模拟"两个向量的外积,所以你可能会认为它是矩阵乘法.但它不可能,因为矩阵乘法不是可交换的,而且在这里(A * B) == (B * A).看看在朱莉娅做同样事情时会发生什么:

julia> A = [1, 2, 3]
3-element Array{Int64,1}:
 1
 2
 3

julia> B = [1 2 3]
1x3 Array{Int64,2}:
 1  2  3

julia> A * B
3x3 Array{Int64,2}:
 1  2  3
 2  4  6
 3  6  9

julia> B * A
1-element Array{Int64,1}:
 14
Run Code Online (Sandbox Code Playgroud)

在这里,B * A为您提供正确的点积.numpy.dot如果你想要真正的比较,请尝试.

如果您使用的是Python 3.5或更高版本,您还可以使用新的内置点积运算符!只需确保矩阵的形状对齐:

>>> A
array([[1, 2, 3]])
>>> B
array([[1],
       [2],
       [3]])
>>> A @ B
array([[14]])
>>> B @ A
array([[1, 2, 3],
       [2, 4, 6],
       [3, 6, 9]])
Run Code Online (Sandbox Code Playgroud)


Dav*_*ers 5

朴素矩阵乘法采用 N^3 运算的顺序。您可以做一个简单的基准测试来查看这种增长:

function myFunc(N)
    A = rand(N, N)
    B = rand(N, N)

    A*B
end

myFunc(1)   # run once to compile

sizes = [floor(Int, x) for x in logspace(1, 3.5, 50)]

times = [@elapsed(myFunc(n)) for n in sizes]

using PyPlot

loglog(sizes, times, "o-")
Run Code Online (Sandbox Code Playgroud)

为了更认真地做到这一点,我会对每个尺寸的几次运行进行平均。我得到类似下图的东西。在此输入图像描述 事实上,在我的计算机上外推到 N=10^4 大约需要 20 或 30 秒。(更严重的是,我会在双对数图上拟合一条直线来进行外推。)