SciPy 中线性方程的求解时间

Question

SciPy 中线性方程的求解时间

H. *_*iyu 2 python numpy linear-algebra scipy

这是我求解线性系统方程的 4 个函数的 python 代码：

def inverse_solution(A, B):
    inv_A = scipy.linalg.inv(A)
    return [numpy.dot(inv_A, b) for b in B]

def scipy_standart_solution(A, B):
    return [scipy.linalg.solve(A, b) for b in B]

def cholesky_solution(A, B):
    K = scipy.linalg.cholesky(A, lower = True)
    t_K = K.T
    return [scipy.linalg.solve_triangular(t_K, scipy.linalg.solve_triangular(K, b, lower = True)) for b in B]

def scipy_cholesky_solution(A, B):
    K = scipy.linalg.cho_factor(A)
    return [scipy.linalg.cho_solve(K, b) for b in B]

Run Code Online (Sandbox Code Playgroud)

我知道第一个解决方案效率不高，如果中的元素数量b小，则第二个解决方案很好，如果b大，则解决方案 3 和 4 很好。

但我的测试结果恰恰相反

A = numpy.array([[1,0.000000001],[0.000000001,1]])
for length in range(5):
    B = numpy.random.rand(length + 1,2)
    r_1 = %timeit -o -q inverse_solution(A,B)
    r_2 = %timeit -o -q scipy_standart_solution(A,B)
    r_3 = %timeit -o -q cholesky_solution(A, B)
    r_4 = %timeit -o -q scipy_cholesky_solution(A,B)
    print[r_1.best, r_2.best, r_3.best, r_4.best, length + 1]
print("////////////////////////////")
A = scipy.linalg.hilbert(12)
for length in range(5):
    B = numpy.random.rand(length + 1,12)
    r_1 = %timeit -o -q inverse_solution(A,B)
    r_2 = %timeit -o -q scipy_standart_solution(A,B)
    r_3 = %timeit -o -q cholesky_solution(A, B)
    r_4 = %timeit -o -q scipy_cholesky_solution(A,B)
    print[r_1.best, r_2.best, r_3.best, r_4.best, length + 1]

Run Code Online (Sandbox Code Playgroud)

输出

[3.4187317043965046e-05, 4.0246286353324035e-05, 0.00010478259103165283, 5.702318102410473e-05, 1]
[5.8342068180991904e-05, 7.186096089739067e-05, 0.00015128208746822017, 8.083242991273707e-05, 2]
[3.369307648390851e-05, 9.87348262759614e-05, 0.00020628010956514232, 0.00012435874243853036, 3]
[3.79271575715201e-05, 0.00013554678863379266, 0.00027863672228316006, 0.0001421170191610699, 4]
[3.5385220680527143e-05, 0.00017145862333669016, 0.0003393085250830197, 0.00017440956920201814, 5]
////////////////////////////
[4.571321046813352e-05, 4.6984071999949605e-05, 9.794712904695047e-05, 5.9280641995266595e-05, 1]
[4.815794144123942e-05, 9.101890875345049e-05, 0.00017026901620170064, 9.290563584772826e-05, 2]
[4.604331714660219e-05, 0.00013565361678288213, 0.0002540085146054736, 0.00012585519183521684, 3]
[4.8241120284303915e-05, 0.0001758718917520369, 0.00031790739992344183, 0.00016162940724917405, 4]
[4.9397840771318616e-05, 0.00021475323253511647, 0.00037772389328304714, 0.00020302321951302815, 5]

Run Code Online (Sandbox Code Playgroud)

为什么会这样？

Answer 1

rom*_*ric 5

您得到这些结果是因为矩阵 ( A& B)的维度太小了。对于如此小的矩阵，调用函数和执行所需检查的开销基本上高于实际计算的成本。实际上，对于2x2逆对称矩阵总是不可避免地比所有其他上述方法更快，仅仅是因为

$\centering \qquad \boldsymbol{A} = \begin{bmatrix} a & b \\ b & c \end{bmatrix} \qquad \Rightarrow \qquad \boldsymbol{A}^{-1} = \frac{1} {ac-b^2} \begin{bmatrix} c & -b \\ -b & a \end{bmatrix}$

这需要两项检查：矩阵是Hermitian（正方形）吗？行列式是非零吗？这加上numpy.dot肯定会击败任何其他方法。

另一方面，调用scipy的标准求解器将需要更多的检查、确定合适的求解器、部分和/或完全旋转等；对 Cholesky 求解器的调用将涉及更多检查，例如矩阵的对称性和正定性（特征值为正），最后两次调用，一个用于 Cholesky 分解，另一个用于三角形求解器将经过许多层，CPython直到到达底层Fortran/C lapack，因此对2x2矩阵来说完全是矫枉过正。这正是您的结果所暗示的。

因此，增加矩阵的大小，您将看到每种方法的实际优点

n = 100
A = np.random.rand(n,n)
A = 0.5*(A+A.T)           # symmetrize
np.fill_diagonal(A,5)     # make sure matrix is positive-definite

B = numpy.random.rand(5,n)

%timeit inverse_solution(A,B)
%timeit scipy_standard_solution(A,B)
%timeit cholesky_solution(A, B)
%timeit scipy_cholesky_solution(A,B)
%timeit scipy.linalg.solve(A,B.T).T

Run Code Online (Sandbox Code Playgroud)

这是我机器上的结果n=100：

1000 loops, best of 3: 998 µs per loop # inverse
100 loops, best of 3: 2.21 ms per loop # standard solver with loops
1000 loops, best of 3: 972 µs per loop # decompose and solve lower tri
1000 loops, best of 3: 505 µs per loop # Cholesky 
1000 loops, best of 3: 530 µs per loop # standard solver w/o loops

Run Code Online (Sandbox Code Playgroud)

将A矩阵的大小增加到 1000（即n=1000），我得到

1 loops, best of 3: 736 ms per loop   # inverse
1 loops, best of 3: 1.24 s per loop   # standard solver with loops
1 loops, best of 3: 209 ms per loop   # decompose and solve lower tri
10 loops, best of 3: 171 ms per loop  # Cholesky
1 loops, best of 3: 254 ms per loop   # standard solver w/o loops

Run Code Online (Sandbox Code Playgroud)

顺便说一下，你的矩阵是dense这样你不应该使用for循环或list理解，因为scipy密集的线性求解器可以处理右侧的矩阵。

归档时间：	10 年，3 月前
查看次数：	1253 次
最近记录：	10 年，3 月前