我已经使用 gensim.models.Word2Vec 训练了 Word2Vec 模型。通过什么方式可以获得这个模型中每个单词的频率?
我在使用scipy.sparse.csr_matrix时遇到问题:
例如:
a = csr_matrix([[1,2,3],[4,5,6]])
b = csr_matrix([[7,8,9],[10,11,12]])
Run Code Online (Sandbox Code Playgroud)
如何将它们合并到
[[1,2,3],[4,5,6],[7,8,9],[10,11,12]]
Run Code Online (Sandbox Code Playgroud)
我知道一种方法是首先将它们转换为numpy数组:
csr_matrix(numpy.vstack((a.toarray(),b.toarray())))
Run Code Online (Sandbox Code Playgroud)
但是当矩阵庞大且稀疏时它将无法工作,因为内存会耗尽.
那么有没有办法在csr_matrix中将它们合并在一起?
任何答案都表示赞赏!