我用 ggplot2 制作了散点图,并将二进制变量映射到点大小。结果令人满意,但我收到警告“不建议使用离散变量的大小”。
据我所知,使用大小来映射具有多个级别的非序数分类变量可能不如使用点形状或不同颜色清晰。然而,我想知道这个警告是否是为了警告我们有更严重的事情。
是否有比使用 aes(size=...) 更明智的方法来根据二进制或分类变量更改点大小?
警告“不建议使用离散变量的大小”只是一个设计技巧吗?
如果我的结果看起来不错,那么下次我想要在相似数据上使用相同类型的图形时,我是否应该担心该警告?
Pandas 数据框可以按其列的值进行排序,但我想按我不想添加到数据框的一系列值对数据框进行排序 - 尽管它具有相同的索引。
我通过将系列添加到数据框(作为列)、排序并再次删除列来对数据框进行排序。示例代码中nprojnpercent是我的数据框,total是我的系列:
nprojnpercent["total"]=total
nprojnpercent.sort_values(by="total",ascending=False,inplace=True)
nprojnpercent.pop("total")
Run Code Online (Sandbox Code Playgroud)
它有效,但对我来说似乎很奇怪。有没有更简单的方法来按系列排序数据框?
我想用根据分类变量着色的点在 Stata 中制作散点图。
我发现这样做的唯一方法是在双向图的图层中编码颜色。
然而,对于这样一个简单的操作,这似乎是一个相当复杂的解决方案:
twoway (scatter latitud longitud if nougrups4 ==1, mcolor(black)) ///
(scatter latitud longitud if nougrups4 ==2, mcolor(blue)) ///
(scatter latitud longitud if nougrups4 ==3, mcolor(red)) ///
(scatter latitud longitud if nougrups4 ==4, mcolor(green))
Run Code Online (Sandbox Code Playgroud)
有没有更简单和自动的方法来做到这一点?
在这种情况下,分类变量nougrups4来自聚类分析。一般的解决方案会很好,但也是绘制集群的特定解决方案。