我有一个图(用 R 制作ggplot2),它是一堆文本数据的奇异值分解的结果,所以我基本上有一个数据集,其中包含一些评论中使用的约 100 个单词和约 10 个评论类别,具有 2D 坐标对于他们每个人来说。由于文本量太大以及许多重要点的距离有多近,我很难让情节看起来清晰。
我的数据现在的结构方式是,我geom_texts用不同的格式绘制两个不同的数据,并为每个数据传递一个单独的坐标数据框。这更容易,因为如果 ~10 个类别与 ~100 个术语重叠(这是次要的)就可以了,而且我想要这两个类别有相当不同的格式,但不一定有理由不能将它们放在一起数据框,geom我想是否有人能找到解决方案。
我想做的是使用该ggrepel功能,使 ~10 个类别相互排斥,并使用该shadowtext功能使它们从彩色单词的背景中脱颖而出,但由于它们不同,geom我不确定如何为了实现这一目标。
带有一些虚假数据的最小示例:
library(ggplot2)
library(ggrepel)
library(shadowtext)
dictionary <- c("spicy", "Thanksgiving", "carborator", "mixed", "cocktail", "stubborn",
"apple", "rancid", "table", "antiseptic", "sewing", "coffee", "tragic",
"nonsense", "stufing", "words", "bottle", "distillery", "green")
set.seed(1)
data.frame(
Dim1 = rnorm(100),
Dim2 = rnorm(100),
Term = sample(dictionary, 100, replace = TRUE),
Color = as.factor(sample.int(10, 100, replace = TRUE))
) -> words
data.frame( …Run Code Online (Sandbox Code Playgroud)