所以我有多个文本文件(大约 40 个)。每个文件大约有 2000 篇文章(平均每篇 500 字)。每个文档都是文本文件中的一行。
因此,由于内存限制,我想使用这些文本文件的动态加载来进行训练。(也许是一个迭代器类?)
那么我该如何进行呢?
python iterator gensim word2vec
gensim ×1
iterator ×1
python ×1
word2vec ×1