data.table聚合到列表列

Mag*_*out 4 r data.table

我正在尝试聚合data.table中的数据以创建一个新列,该列是以前的行列表.通过示例更容易看到:

dt <- data.table(id = c(1,1,1,1,2,2,3,3,3), letter = c('a','a','b','c','a','c','b','b','a'))
Run Code Online (Sandbox Code Playgroud)

我希望以这样的方式聚合它,结果应该是

   id  letter
1:  1 a,a,b,c
2:  2     a,c
3:  3   b,b,a  
Run Code Online (Sandbox Code Playgroud)

直觉我试过了

dt[,j = list(list(letter)), by = id]
Run Code Online (Sandbox Code Playgroud)

但这不起作用.当我逐个案例时,奇怪的是,例如:

> dt[id == 1,j = list(list(letter)), by = id]

   id      V1
1:  1 a,a,b,c
Run Code Online (Sandbox Code Playgroud)

结果很好......我觉得我错过了.SD某个地方或类似的东西......

任何人都能指出我正确的方向吗?

谢谢!

sha*_*dow 5

更新:行为DT[, list(list(.)), by=.]有时导致R版本> = 3.1.0中的错误结果.现在,在data.table v1.9.3的当前开发版本的commit#1280中修复了这个问题.来自新闻:

  • DT[, list(list(.)), by=.]在R> = 3.1.0中也返回正确的结果.该错误是由于R v3.1.0中的最近(欢迎)更改list(.)导致副本无效.关闭#481.

有了这个更新,它就不再需要I()了.你可以这样做:DT[, list(list(.)), by=.]像以前一样.


这似乎与已知的bug#5585类似.在你的情况下,我认为你可以使用

dt[, paste(letter, collapse=","), by = id] 
Run Code Online (Sandbox Code Playgroud)

解决你的问题.

正如@ilir所指出的,如果实际上需要获取列表(而不是显示的字符),您可以使用错误报告中建议的解决方法:

dt[, list(list(I(letter))), by = id]
Run Code Online (Sandbox Code Playgroud)