我有一个(相当长的)矢量列表.这些向量由我使用strsplit()句子函数得到的俄语单词组成.
以下是head()返回的内容:
[[1]]
[1] "?????" "?????????" "??????" "?" "????"
[[2]]
[1] "??" "?????????" "????????" "?" "?????"
[[3]]
[1] "?????" "????????" "??????-?????????" "?" "??????????" "???????"
[[4]]
[1] "?????" "??" "????," "???" "??"
[[5]]
[1] "????????????," "?" "?????????" "??" "?????"
[[6]]
[1] "??????" "??????????" "???."
Run Code Online (Sandbox Code Playgroud)
注意,矢量具有不同的长度.
我想要的是能够阅读每个句子,第二个单词,第三个单词等的第一个单词.
期望的结果将是这样的:
P1 P2 P3 P4 P5 P6
[1] "?????" "?????????" "??????" "?" "????" NA
[2] "??" "?????????" "????????" "?" "?????" NA
[3] "?????" "????????" "??????-?????????" "?" "??????????" "???????"
[4] "?????" "??" …Run Code Online (Sandbox Code Playgroud)