Chi*_*ing 1 r spread dplyr tidyr
因此,目前我正在尝试弄清楚如何从 MovieLense 构建电影推荐系统(https://grouplens.org/datasets/movielens/100k/)。我阅读了教程中的一些说明。
library(dplyr)
library(recommenderlab)
library(magrittr)
data <- read.table("u.data", header = F, stringsAsFactors = T)
head(data)
V1 V2 V3 V4
1 196 242 3 881250949
2 186 302 3 891717742
3 22 377 1 878887116
4 244 51 2 880606923
5 166 346 1 886397596
6 298 474 4 884182806
Run Code Online (Sandbox Code Playgroud)
说明:V1是 userid,V2是 itemid,V3是 rating
现在我需要将格式记录到 ratingMatrix,结果将是这样的:
1 2 3 4 5 6 7 8 9 10
1 5 3 4 3 3 5 4 1 5 3
2 4 NA NA NA NA NA NA NA NA 2
3 NA NA NA NA NA NA NA NA NA NA
4 NA NA NA NA NA NA NA NA NA NA
5 4 3 NA NA NA NA NA NA NA NA
6 4 NA NA NA NA NA 2 4 4 NA
7 NA NA NA 5 NA NA 5 5 5 4
8 NA NA NA NA NA NA 3 NA NA NA
9 NA NA NA NA NA 5 4 NA NA NA
10 4 NA NA 4 NA NA 4 NA 4 NA
Run Code Online (Sandbox Code Playgroud)
代码:
temp = data %>% select(1:3) %>% spread(V2,V3) %>% select(-1)
temp[1:10,1:10]
Run Code Online (Sandbox Code Playgroud)
spread(., V2, V3) 中的错误:找不到函数“spread”
| 归档时间: |
|
| 查看次数: |
9076 次 |
| 最近记录: |