将数据框中的每个列表转换为普通列

lit*_*tes 3 r data-conversion dataframe

我从网络上的多个来源生成了一个数据框,这些数据框事先经过清理,然后使用

cleans <- ls() 
cleans <- cleans[grepl("Clean_News", cleans)]
Run Code Online (Sandbox Code Playgroud)

我第一次尝试将它们绑定在一起的灵感来自 Stack Overflow 上的一个解决方案:

All_News <- mapply(get, grep("Clean_News", ls(), value=T))
All_News <- data.frame(t(All_News))
All_News <- as.data.frame(All_News)
Run Code Online (Sandbox Code Playgroud)

然而,这对我来说是一个问题,因为结果是一个数据框,其中每列都是整数或字符的列表。所以,我的主要问题是如何将数据框中的每个列表转换为 df 中的普通列。我在 Stack Overflow 上尝试了很多手工制作的函数,但没有一个对我有用(我猜是因为我缺乏经验......)。df 的形式为

All_News <- data.frame(a=I(list(1,1:2,1:3)), b=I(list(4:6,7:9,10:11)))
Run Code Online (Sandbox Code Playgroud)

或者,我尝试了以下方法,该方法有效:

All_News <- do.call(rbind, lapply(cleans, get))
Run Code Online (Sandbox Code Playgroud)

但有一个巨大的缺点,那就是我没有成功地将数据框的名称作为行名/或第一列放入数据框中......所以,我的第二个问题是如何将单个数据框的名称附加到每个数据框巨大 df 的行,而不是像下面的代码行那样的 id。

t2 <- rbindlist(lapply(cleans, get), idcol = "id") 
Run Code Online (Sandbox Code Playgroud)

这并没有多大好处,因为我需要重复使用所有数据帧的名称 x 次作为标识符,例如,并且由于这是一个包含数千个网页的自动化过程,所以我事先不知道每个数据帧中的行数。数据如下:

 news1 data1 data2
 news1 data5 data6
 news2 data3 data4
 and so on.
Run Code Online (Sandbox Code Playgroud)

我尝试了一些类似的事情

nr <- length(cleans)
names <- rep(cleans, nr)
names <- sort(names)
Run Code Online (Sandbox Code Playgroud)

但没有取得多大成功。

akr*_*run 6

我们可以通过循环数据集的列来做到unlistlist一点

lst <- lapply(All_News, unlist)
Run Code Online (Sandbox Code Playgroud)

list然后,根据最大长度( ),对元素较少的元素在末尾填充 NA ,使元素的长度相同max(lengths(lst)),并将其转换为data.frame

data.frame(lapply(lst, `length<-`, max(lengths(lst))))
Run Code Online (Sandbox Code Playgroud)