选择如何聚合稀疏矩阵中的重复索引

And*_*dyK 5 python scipy sparse-matrix

当我们从 构造 scipy 稀疏矩阵(例如coo_matrixcsc_matrixcsr_matrix)时(data, (row_ind, col_ind)),默认情况下重复的条目(row_ind, col_ind)会被累加在一起。例如:

from scipy.sparse import coo_matrix

row_ind  = [0, 0, 0, 2, 0, 0]
col_ind  = [0, 0, 0, 2, 1, 1]
data = [1, 1, 1, 1, 1, 1]

coo_matrix((data, (row_ind, col_ind))).todense()

matrix([[3, 2, 0],
        [0, 0, 0],
        [0, 0, 1]])
Run Code Online (Sandbox Code Playgroud)

有没有办法指定另一个操作,例如min, maxmean而不是sum?此外,拥有类似sum_duplicates()这些操作的方法也会很有用。