列出R中给定产品ID的所有产品

LFo*_*s24 1 r matrix correlation

我对R很新,所以如果这个问题相对较新,我会道歉.我有一个大约33,000行的列表,显示订单ID和订单ID中订购的产品.结构如下:

Order.ID    Product  
193505  Pineapple Cheddar Burger  
193505  Onion Rings  
193564  Pineapple Cheddar Burger  
193623  Hamburger  
193623  French Fries  
193623  Fountain Soda  
193623  Hot Dog  
193631  Hamburger  
193631  French Fries  
193631  Milkshake  
193644  Daily Special  
193726  Hamburger  
193726  French Fries  
193726  Fountain Soda  
193728  Hamburger  
193728  French Fries  
193728  Fountain Soda  
193738  Hamburger  
193738  French Fries  
193762  Hamburger  
193762  French Fries  
193762  Fountain Soda  
193762  Hamburger  
193762  French Fries  
193762  Fountain Soda
Run Code Online (Sandbox Code Playgroud)

我想生成一个相关矩阵,它反映了与每个其他项目在同一订单ID中订购的每个项目的相关性.我开始使用a table(ID, Product)给了我每个订单中订购的产品.现在我被困在如何计算每个其他产品(产品2-k)的订单数量,因为已经订购了产品1.理想情况下,我想对每个产品进行分析并将其转换为矩阵,但正确评估一个似乎是合乎逻辑的第一步.

我将不胜感激任何有关此问题的指导.提前致谢.

小智 5

我建议查看arules包(http://cran.r-project.org/web/packages/arules/index.html).特别是你正在寻找频繁的项目集:

sets = apriori(asc, parameter=list(target="freq"))
Run Code Online (Sandbox Code Playgroud)

它将能够找出所有组合.您将不得不更改数据的格式,但table()应该是一个好的开始.

它不仅可以返回2个产品的分布,还可以返回所有组合.

你正在寻找一套的支持,所以使用:

inspect(sets)
Run Code Online (Sandbox Code Playgroud)