在R中将字符串拆分为100个字的部分

Ale*_*nov 2 string split r

如何将一个巨大的"字符"拆分成较小的字符,每个字符包含100个单词.例如,这就是我以前用单个词分割它的方式.

myCharSplitByWords <- strsplit(myCharUnSplit, " ")[[1]]
Run Code Online (Sandbox Code Playgroud)

我认为这可以用正则表达式完成(可能选择第100个空格或smth)但是无法写出正确的表达式

我是R的新手,我完全陷入困境.谢谢

sgi*_*ibb 6

也许有一种使用正则表达式的方法,但之后strsplit用"手"将单词分组会更容易:

## example data
set.seed(1)
string <- paste0(sample(c(LETTERS[1:10], " "), 1e5, replace=TRUE), collapse="")

## split if there is at least one space
words <- strsplit(string, "\\s+")[[1]]

## build group index
group <- rep(seq(ceiling(length(words)/100)), each=100)[1:length(words)]

## split by group index
words100 <- split(words, group)
Run Code Online (Sandbox Code Playgroud)