比较R中的数据集

Evi*_* So 4 compare r associations dataset substitution

我已经在以下格式的CSV文件中收集了一组事务:

{Pierre, lait, oeuf, beurre, pain}
{Paul, mange du pain,jambon, lait}
{Jacques, oeuf, va chez la crémière, pain, voiture}
Run Code Online (Sandbox Code Playgroud)

我打算做一个简单的关联规则分析,但首先我想从每个不属于的事务中排除项目ReferenceSet = {lait, oeuf, beurre, pain}.

因此,在我的示例中,我的结果数据集将是:

{Pierre, lait, oeuf, beurre, pain}
{Paul,lait}
{Jacques, oeuf, pain,}
Run Code Online (Sandbox Code Playgroud)

我确信这很简单,但是我很乐意阅读建议/答案以帮助我.

Ben*_*ker 5

另一个答案的引用%in%,但在这种情况下,intersect甚至更加便利(你可能想看看match,太-但我认为这是在同一个地方的文档%in%) -与lapplyintersect我们可以把答案变成一个班轮:

数据:

> L <- list(pierre=c("lait","oeuf","beurre","pain") ,
+           paul=c("mange du pain", "jambon", "lait"),
+           jacques=c("oeuf","va chez la crémière", "pain", "voiture"))
> reference <- c("lait", "oeuf", "beurre", "pain")
Run Code Online (Sandbox Code Playgroud)

回答:

> lapply(L,intersect,reference)
$pierre
[1] "lait"   "oeuf"   "beurre" "pain"  

$paul
[1] "lait"

$jacques
[1] "oeuf" "pain"
Run Code Online (Sandbox Code Playgroud)