Cor*_*one 9 r class dataframe reshape2
我不知道这是一个integer64(从bit64)问题,还是一个融化问题(来自reshape2,但如果我尝试重塑一个包含integer64数据的data.frame,那么类信息会在进程中被销毁,并且它会恢复为双重表示:
library(bit64)
library(reshape2)
DF = data.frame(I =letters, Num1 = as.integer64(1:26), Num2 = as.integer64(1:26))
DFM = melt(DF, id.vars = "I")
sapply(DF, class)
sapply(DFM, class)
Run Code Online (Sandbox Code Playgroud)
得到:
> sapply(DF, class)
I Num1 Num2
"factor" "integer64" "integer64"
> sapply(DFM, class)
I variable value
"factor" "factor" "numeric"
Run Code Online (Sandbox Code Playgroud)
因为integer64是下面的两倍,数据"被破坏"
> DF
I Num1 Num2
1 a 1 1
2 b 2 2
3 c 3 3
4 d 4 4
5 e 5 5
...
> DFM
I variable value
1 a Num1 4.940656e-324
2 b Num1 9.881313e-324
3 c Num1 1.482197e-323
4 d Num1 1.976263e-323
5 e Num1 2.470328e-323
6 f Num1 2.964394e-323
Run Code Online (Sandbox Code Playgroud)
是什么造成的?这是一个integer64问题还是一个melt问题?在创建类时可以做些什么来避免这种事情?
这似乎是对软件包的限制,这也在第9页的文档中提到过.例如:
x <- data.frame(a=as.integer64(1:5), b=as.integer64(1:5))
> x
# a b
# 1 1 1
# 2 2 2
# 3 3 3
# 4 4 4
# 5 5 5
> unlist(x)
# a1 a2 a3 a4 a5 b1
# 4.940656e-324 9.881313e-324 1.482197e-323 1.976263e-323 2.470328e-323 4.940656e-324
# b2 b3 b4 b5
# 9.881313e-324 1.482197e-323 1.976263e-323 2.470328e-323
> as.matrix(x)
# a b
# [1,] 4.940656e-324 4.940656e-324
# [2,] 9.881313e-324 9.881313e-324
# [3,] 1.482197e-323 1.482197e-323
# [4,] 1.976263e-323 1.976263e-323
# [5,] 2.470328e-323 2.470328e-323
x <- as.integer64(1:5)
> is.vector(x)
# [1] FALSE
> as.vector(x)
# [1] 4.940656e-324 9.881313e-324 1.482197e-323 1.976263e-323 2.470328e-323
Run Code Online (Sandbox Code Playgroud)
重置课程似乎“纠正”了结果,见下文。但是,正如在讨论中提到的,如果数值还包含除integer64.
> class(DFM$value) <- "integer64"
> DFM
I variable value
1 a Num1 1
2 b Num1 2
3 c Num1 3
Run Code Online (Sandbox Code Playgroud)
| 归档时间: |
|
| 查看次数: |
595 次 |
| 最近记录: |