小编RKF*_*RKF的帖子

我如何计算,在一个会话中总共有多少个项目?

我真的尽我最大的努力通过 stackoverflow 搜索解决方案,但不幸的是我找不到合适的问题。因此,我必须自己提出一个问题。

我正在处理一个包含 sessionID 和主题的数据集。想象它看起来像这样:

sessionID <- c(1, 2, 2, 3, 4, 4, 5, 6, 6, 6)
topic <- c("rock", "house", "country", "rock", "r'n'b", "pop", "classic", "house", "rock", "country")
transactions <- cbind(sessionID, topic)
transactions
Run Code Online (Sandbox Code Playgroud)

现在,我想知道某个主题的多少项目一起出现在一个会话中。最后,我想获得一个矩阵,表示特定主题与其他主题进行会话的频率。最终结果应如下所示:

topics <- sort(unique(topic))
topicPairs <- matrix(NA, nrow = length(topics), ncol = length(topics))
colnames(topicPairs) <- topics
rownames(topicPairs) <- topics
topicPairs["house", "country"] <- 2
topicPairs["country", "house"] <- 2
topicPairs["r'n'b", "pop"] <- 1
topicPairs["pop", "r'n'b"] <- 1
topicPairs["rock", "house"] <- 1
topicPairs["house", "rock"] <- 1
topicPairs["rock", "country"] …
Run Code Online (Sandbox Code Playgroud)

r dplyr tidyr tidyverse data-wrangling

0
推荐指数
1
解决办法
149
查看次数

标签 统计

data-wrangling ×1

dplyr ×1

r ×1

tidyr ×1

tidyverse ×1