我有从数据库索引user_id并analysis_type_id从数据库获取的数据(计数).这是一个3元组的列表.样本数据:
counts = [(4, 1, 4), (3, 5, 4), (2, 10, 4), (2, 10, 5)]
Run Code Online (Sandbox Code Playgroud)
其中每个元组的第一项是count,第二个analysis_type_id,最后的user_id.
我想将它放入字典中,所以我可以快速检索计数:给出a user_id和analysis_type_id.它必须是一个两级字典.有没有更好的结构?
要"手动"构建两级字典,我会编码:
dict = {4:{1:4,5:3,10:2},5:{10:2}}
Run Code Online (Sandbox Code Playgroud)
user_id第一个dict键级别在哪里,analysis_type_id是第二个(子)键,count是dict中的值.
如何通过列表理解在dict键中创建"双深度"?或者我是否需要求助于嵌套的for循环,我首先遍历唯一user_id值,然后找到匹配analysis_type_id并在dict中一次一个地填写计数?
我试图让ggplot2的geom_boxplot的胡须覆盖异常值.事实上,异常值不会显示为点,因为它们被箱图包围.
如果我使用标准的'boxplot',我将使用:
boxplot(x, range=n)
Run Code Online (Sandbox Code Playgroud)
其中ñ将是一个大数目,使得,而不是显示异常值,该箱线图的胡子延伸覆盖异常值.
如何用ggplot2完成?我试过了:
ggplot(myDF, aes(x=x, y=y)) +
geom_boxplot(range = 5)
Run Code Online (Sandbox Code Playgroud)
注意:我不想使用以下内容丢弃异常值:
geom_boxplot(outlier.shape = NA)
Run Code Online (Sandbox Code Playgroud)