Evi*_* So 4 compare r associations dataset substitution
我已经在以下格式的CSV文件中收集了一组事务:
{Pierre, lait, oeuf, beurre, pain}
{Paul, mange du pain,jambon, lait}
{Jacques, oeuf, va chez la crémière, pain, voiture}
Run Code Online (Sandbox Code Playgroud)
我打算做一个简单的关联规则分析,但首先我想从每个不属于的事务中排除项目ReferenceSet = {lait, oeuf, beurre, pain}
.
因此,在我的示例中,我的结果数据集将是:
{Pierre, lait, oeuf, beurre, pain}
{Paul,lait}
{Jacques, oeuf, pain,}
Run Code Online (Sandbox Code Playgroud)
我确信这很简单,但是我很乐意阅读建议/答案以帮助我.
另一个答案的引用%in%
,但在这种情况下,intersect
甚至更加便利(你可能想看看match
,太-但我认为这是在同一个地方的文档%in%
) -与lapply
和intersect
我们可以把答案变成一个班轮:
数据:
> L <- list(pierre=c("lait","oeuf","beurre","pain") ,
+ paul=c("mange du pain", "jambon", "lait"),
+ jacques=c("oeuf","va chez la crémière", "pain", "voiture"))
> reference <- c("lait", "oeuf", "beurre", "pain")
Run Code Online (Sandbox Code Playgroud)
回答:
> lapply(L,intersect,reference)
$pierre
[1] "lait" "oeuf" "beurre" "pain"
$paul
[1] "lait"
$jacques
[1] "oeuf" "pain"
Run Code Online (Sandbox Code Playgroud)