R - 在单个变量中将多个值作为一个字符串处理

Question

在a中data.frame,我有一个用于文本语言的分类变量.但是,虽然大多数文本只使用一种语言,但有些语言只有多种语言.在我的数据中,它们出现在同一列中,除以逗号:

text = c("Text1", "Text2", "Text3")
lang = c("fr", "en", "fr,en")
d = data.frame(text, lang)

视觉:

   text  lang
1 Text1    fr
2 Text2    en
3 Text3 fr,en

我想绘制每种语言的文本数量,Text3在内部fr和内部计算en.

我找到了如何拆分,用:

d$lang <- strsplit(d$lang, ",")

但后来我无法找到正确绘制方法,例如使用qplot像这样的条形图:

qplot(lang, data=d)

我做得对吗？有更好的方法吗？

Answer 1

你可以尝试:

library(splitstackshape)
dl <- cSplit(d, "lang", ",", "long")
qplot(lang, data = dl)