LFo*_*s24 1 r matrix correlation
我对R很新,所以如果这个问题相对较新,我会道歉.我有一个大约33,000行的列表,显示订单ID和订单ID中订购的产品.结构如下:
Order.ID Product
193505 Pineapple Cheddar Burger
193505 Onion Rings
193564 Pineapple Cheddar Burger
193623 Hamburger
193623 French Fries
193623 Fountain Soda
193623 Hot Dog
193631 Hamburger
193631 French Fries
193631 Milkshake
193644 Daily Special
193726 Hamburger
193726 French Fries
193726 Fountain Soda
193728 Hamburger
193728 French Fries
193728 Fountain Soda
193738 Hamburger
193738 French Fries
193762 Hamburger
193762 French Fries
193762 Fountain Soda
193762 Hamburger
193762 French Fries
193762 Fountain Soda
Run Code Online (Sandbox Code Playgroud)
我想生成一个相关矩阵,它反映了与每个其他项目在同一订单ID中订购的每个项目的相关性.我开始使用a table(ID, Product)给了我每个订单中订购的产品.现在我被困在如何计算每个其他产品(产品2-k)的订单数量,因为已经订购了产品1.理想情况下,我想对每个产品进行分析并将其转换为矩阵,但正确评估一个似乎是合乎逻辑的第一步.
我将不胜感激任何有关此问题的指导.提前致谢.
小智 5
我建议查看arules包(http://cran.r-project.org/web/packages/arules/index.html).特别是你正在寻找频繁的项目集:
sets = apriori(asc, parameter=list(target="freq"))
Run Code Online (Sandbox Code Playgroud)
它将能够找出所有组合.您将不得不更改数据的格式,但table()应该是一个好的开始.
它不仅可以返回2个产品的分布,还可以返回所有组合.
你正在寻找一套的支持,所以使用:
inspect(sets)
Run Code Online (Sandbox Code Playgroud)