我是R的新手,并且已经开始欣赏ggplot2和plyr的优雅.现在,我正在尝试分析一个我不能在这里分享的大型数据集,但我用钻石数据集重建了我的问题(为方便起见缩短了).无需再费周折:
diam <- diamonds[diamonds$cut=="Fair"|diamonds$cut=="Ideal",]
boxplots <- ggplot(diam, aes(x=cut, price)) + geom_boxplot(aes(fill=cut)) + facet_wrap(~ color)
print(boxplots)
Run Code Online (Sandbox Code Playgroud)

情节产生的是一组箱图,比较两个削减"公平"和"理想"的价格.
我现在非常希望通过t.test或wilcox.test统计比较每个颜色子组(D,E,F,..,J)的两个切割.
我将如何以与ggplot2-syntax一样优雅的方式实现它?我假设我会使用plyr-package中的ddply,但我无法弄清楚如何将两个子组提供给计算相应统计信息的函数.
我使用 R 包 randomForestSRC 训练了一个随机生存森林。为了出版,我想可视化一些选定的树,最好使用 ggraph 包,就像这里一样: https: //shiring.github.io/machine_learning/2017/03/16/rf_plot_ggraph
randomForest 包有一个方便的函数 randomForest::getTree,但到目前为止,我还没有在 randomForestSRC 中找到类似的函数。树木如何存储在随机生存森林中,以及如何访问它们?如果有任何提示,我将不胜感激!