我有一个数据框,大部分是零(稀疏数据帧?)类似于
name,factor_1,factor_2,factor_3
ABC,1,0,0
DEF,0,1,0
GHI,0,0,1
Run Code Online (Sandbox Code Playgroud)
实际数据大约是90,000行,包含10,000个功能.我可以将其转换为稀疏矩阵吗?我期望通过利用稀疏矩阵而不是数据帧来获得时间和空间效率.
任何帮助,将不胜感激
更新#1:这是生成数据帧的一些代码.谢谢理查德提供这个
x <- structure(list(name = structure(1:3, .Label = c("ABC", "DEF", "GHI"),
class = "factor"),
factor_1 = c(1L, 0L, 0L),
factor_2 = c(0L,1L, 0L),
factor_3 = c(0L, 0L, 1L)),
.Names = c("name", "factor_1","factor_2", "factor_3"),
class = "data.frame",
row.names = c(NA,-3L))
Run Code Online (Sandbox Code Playgroud)