为什么skipgram模型比CBOW模型花费更多的时间。我用相同的参数(向量大小和窗口大小)训练模型。
我有一个 Spark Rdd,其形式为 Row(id,Words),其中单词包含单词列表。我想将此列表转换为单列。输入
ID Words
1 [w1,w2,w3]
2 [w3,w4]
Run Code Online (Sandbox Code Playgroud)
我想将其转换为输出格式
ID Word
1 w1
1 w2
1 w3
2 w3
2 w4
Run Code Online (Sandbox Code Playgroud)