为什么使用数字键进行子集化不适用于data.table

Ada*_*NYC 13 r data.table

我有一个包含两个数字行的表,其中一行设置为key.我想data.table通过数字键值对我进行子集化,但它似乎不起作用.当我将它转换为字符时,它的工作原理.

你能帮我理解为什么吗?我正在使用data.table 1.8.6.

谢谢一堆.这是测试代码:

> ID <-c(rep(210, 9), rep(3917,6))
> Count <- c(1,1,0,1,1,1,1,1,1,1,1,1,1,0,1)
> x <- data.table(ID, Count)
> 
> # numeric key doesn't work with i argument
> setkey(ID)
 [1]  210  210  210  210  210  210  210  210  210 3917 3917 3917 3917 3917 3917
> x[210,list(ID, Count)]
   ID Count
1: NA    NA
> 
> # create character key
> x$charID <- as.character(x$ID)
> setkey(x, charID)
> x["210",list(ID, Count)]
   charID  ID Count
1:    210 210     1
2:    210 210     1
3:    210 210     0
4:    210 210     1
5:    210 210     1
6:    210 210     1
7:    210 210     1
8:    210 210     1
9:    210 210     1
Run Code Online (Sandbox Code Playgroud)

mne*_*nel 17

您需要在data.table中发送数字键.这很容易使用J.或者在列表中

请注意,在设置密钥时需要指定data.table

setkey(x, ID)
x[J(210)]
    ID Count
1: 210     1
2: 210     1
3: 210     0
4: 210     1
5: 210     1
6: 210     1
7: 210     1
8: 210     1
9: 210     1
Run Code Online (Sandbox Code Playgroud)

要么

x[list(210)]
    ID Count
1: 210     1
2: 210     1
3: 210     0
4: 210     1
5: 210     1
6: 210     1
7: 210     1
8: 210     1
9: 210     1
Run Code Online (Sandbox Code Playgroud)


Ric*_*rta 5

当你问R x[210, ]是否正在寻找第210排x.
如果x有210多行,它将返回该值(尽管不是您想要的行).由于没有第210行,它会给你NA.

当您要求时x['210', ],它正在寻找x标记的行'210'



试试这个看看差异:

 vec <- LETTERS[1:9]
 names(vec) <- c(11:18, 1)
Run Code Online (Sandbox Code Playgroud)

现在比较:

 vec[[11]]
 vec[['11']]


 vec[[1]]
 vec[['1']]
Run Code Online (Sandbox Code Playgroud)