小编wis*_*ame的帖子

ggplot:如何更改构面标签?

我使用了以下ggplot命令:

ggplot(survey, aes(x = age)) + stat_bin(aes(n = nrow(h3), y = ..count.. / n), binwidth = 10)
  + scale_y_continuous(formatter = "percent", breaks = c(0, 0.1, 0.2))
  + facet_grid(hospital ~ .)
  + theme(panel.background = theme_blank())
Run Code Online (Sandbox Code Playgroud)

生产

替代文字

我想将facet标签更改为更短的标签(如Hosp 1,Hosp 2 ......),因为它们现在太长并且看起来很狭窄(增加图形的高度不是一个选项,它需要文档中的空间太大).我查看了facet_grid帮助页面,但无法弄清楚如何.

symbols r facet ggplot2 plotmath

210
推荐指数
11
解决办法
21万
查看次数

在分类变量图表中显示%而不是计数

我正在绘制一个分类变量,而不是显示每个类别值的计数.

我正在寻找一种方法来ggplot显示该类别中的值的百分比.当然,有可能用计算的百分比创建另一个变量并绘制一个变量,但我必须做几十次,我希望在一个命令中实现它.

我正在尝试类似的东西

qplot(mydataf) +
  stat_bin(aes(n = nrow(mydataf), y = ..count../n)) +
  scale_y_continuous(formatter = "percent")
Run Code Online (Sandbox Code Playgroud)

但我必须错误地使用它,因为我有错误.

为了轻松重现设置,这里有一个简化的例子:

mydata <- c ("aa", "bb", NULL, "bb", "cc", "aa", "aa", "aa", "ee", NULL, "cc");
mydataf <- factor(mydata);
qplot (mydataf); #this shows the count, I'm looking to see % displayed.
Run Code Online (Sandbox Code Playgroud)

在实际情况中,我可能会使用ggplot而不是qplot,但使用stat_bin的正确方法仍然无法使用.

我也试过这四种方法:

ggplot(mydataf, aes(y = (..count..)/sum(..count..))) + 
  scale_y_continuous(formatter = 'percent');

ggplot(mydataf, aes(y = (..count..)/sum(..count..))) + 
  scale_y_continuous(formatter = 'percent') + geom_bar();

ggplot(mydataf, aes(x = levels(mydataf), y = …
Run Code Online (Sandbox Code Playgroud)

r ggplot2

160
推荐指数
9
解决办法
20万
查看次数

Maven:如何覆盖库添加的依赖项

这是我的一般问题:

我的项目P取决于A,它取决于B,它取决于C,这取决于D的1.0.1版本.

D版本1.0.1存在问题,我想强制使用另一个模块.我不知道如何在我的项目的POM中声明这个,因为我没有直接添加对D的依赖.这是C声明对D的依赖.

重要说明:在这种情况下,不仅更改了版本,还更改了组和工件.因此,这不仅仅是覆盖依赖项的版本,而是排除模块并包含另一个模块.

在具体的情况下,D是StAX,其1.0.1有一个bug.根据bug中的注释,"通过用stax-api-1.0-2(maven GroupId = javax.xml.stream)替换stax-api-1.0.1(maven GroupId = stax)来解决问题"所以我我正在努力.

因此,D = stax:stax-api:jar:1.0.1和C = org.apache.xmlbeans:xmlbeans:jar:2.3.0

我正在使用maven 2.0.9以防万一.

输出mvn依赖:tree"

mvn dependency:tree
[..snip..]
[INFO] +- org.apache.poi:poi-ooxml:jar:3.6:compile
[INFO] |  +- org.apache.poi:poi-ooxml-schemas:jar:3.6:compile
[INFO] |  |  +- org.apache.xmlbeans:xmlbeans:jar:2.3.0:compile
[INFO] |  |  |  \- stax:stax-api:jar:1.0.1:compile
Run Code Online (Sandbox Code Playgroud)

在我的项目的POM中,我对"A"有以下依赖:

<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi</artifactId>
    <version>3.6</version>
</dependency>
<dependency>
    <groupId>org.apache.poi</groupId>
    <artifactId>poi-ooxml</artifactId>
    <version>3.6</version>
</dependency>
Run Code Online (Sandbox Code Playgroud)

提前致谢.

dependencies maven-2

106
推荐指数
5
解决办法
12万
查看次数

ggplot:如何增加刻面图之间的间距?

我有几个多面的直方图(使用下面的命令获得),它们很好地一个接一个地绘制.我想增加它们之间的间距,但是它们很紧.

我查看了doc,但没有为此找到参数.

提前致谢.

qplot (Happiness.Level, Number.of.Answers, data=mydata, geom="histogram") + facet_grid (Location ~ .) 
Run Code Online (Sandbox Code Playgroud)

r ggplot2

101
推荐指数
2
解决办法
4万
查看次数

如何根据涉及字段的条件提取数据帧的子集?

我有一个大型CSV,其中包含来自不同位置的医疗调查结果(位置是数据中存在的因素).由于某些分析特定​​于某个位置并且为了方便起见,我想仅从这些位置提取具有行的子帧.碰巧该位置是第一个字段所以是的,我可以通过对CSV行进行排序来实现,但我想学习如何在R中进行操作,因为我确信我需要将其用于其他列.

所以,简而言之,问题是:给定一个数据框foo,如何创建另一个数据框条,它只包含来自foo的行foo $ location ='there'?

非常感谢.

r subset dataframe r-faq

59
推荐指数
2
解决办法
19万
查看次数

在Fiddler中显示请求的时间戳?

我收到了一个很长的Fiddler跟踪(有一个复杂的场景),需要将请求与应用程序日志关联起来.

不幸的是,当Fiddler按时间顺序显示请求时,它不会显示请求的时间戳.要访问该信息(记录),我必须右键单击每一行,然后在弹出窗口中查看属性.当必须梳理数百行时,这非常耗时.查看原始捕获数据并不是更好,因为每个请求都有自己的文件,我确实需要Fiddler接口.

迂腐:我知道没有一个时间戳显示(下面是所有记录的时间戳).ClientConnected可以正常(或任何其他,只要它是相同的,允许我直观地关联日志).

谢谢.

== TIMING INFO ============
ClientConnected:        10:32:57:8906
ClientDoneRequest:      10:32:57:8906
Gateway Determination:  0ms
DNS Lookup:         0ms
TCP/IP Connect:         0ms
ServerGotRequest:       10:32:57:9062
ServerBeginResponse:    10:32:58:2812
ServerDoneResponse: 10:32:58:2884
ClientBeginResponse:    10:32:58:2900
ClientDoneResponse: 10:32:58:2912
Run Code Online (Sandbox Code Playgroud)

javascript fiddler

53
推荐指数
1
解决办法
2万
查看次数

计算相关性 - cor() - 仅用于列的子集

我有一个数据框,想要计算相关性(使用Spearman,数据是分类和排名),但仅适用于列的子集.我尝试了所有,但R的cor()函数只接受数字数据(x必须是数字,表示错误信息),即使使用了Spearman.

一种粗暴的方法是从数据框中删除非数字列.这不是那么优雅,对于速度我仍然不想计算所有列之间的相关性.

我希望有一种方法可以简单地说"计算列x,y,z的相关性".列引用可以按编号或按名称进行.我想提供它们的灵活方式是通过矢量.

任何建议表示赞赏.

r correlation

45
推荐指数
2
解决办法
13万
查看次数

以原子方式递增存储在ConcurrentHashMap中的计数器

我想从网络应用中的各个地方收集一些指标.为了简单起见,所有这些都是计数器,因此唯一的修饰符操作是将它们递增1.

增量将是并发的并且经常是.读取(转储统计信息)是一种罕见的操作.

我在考虑使用ConcurrentHashMap.问题是如何正确递增计数器.由于地图没有"增量"操作,我需要首先读取当前值,增加它而不是将新值放在地图中.没有更多代码,这不是原子操作.

是否有可能在没有同步的情况下实现这一点(这会破坏ConcurrentHashMap的目的)?我需要看看番石榴吗?

谢谢你的任何指示.


PS
有一个关于SO的相关问题(在Java中增加Map值的最有效方法)但是侧重于性能而不是多线程

更新
对于那些通过搜索同一主题到达这里的人:除了下面的答案之外,还有一个有用的演示文稿,它偶然涵盖了相同的主题.见幻灯片24-33.

java concurrency multithreading concurrenthashmap guava

35
推荐指数
4
解决办法
2万
查看次数

更简单的方法来绘制ggplot中的累积频率分布?

我正在寻找一种更简单的方法来绘制ggplot中的累积分布线.

我有一些数据,我可以立即显示直方图

qplot (mydata, binwidth=1);
Run Code Online (Sandbox Code Playgroud)

我在http://www.r-tutor.com/elementary-statistics/quantitative-data/cumulative-frequency-graph找到了一种方法,但它涉及几个步骤,在探索数据时耗时.

有没有办法在ggplot中以更直接的方式执行此操作,类似于如何通过指定选项添加趋势线和置信区间?

r ggplot2

30
推荐指数
3
解决办法
3万
查看次数

使用JPA2/Hibernate保留java.time.Instant(JDK8)

JPA和Hibernate目前都不支持JSR-310在JDK8中带来的新日期/时间类(JPA 票证,Hibernate 票证).尽管如此,我想用JDK8日期/时间类进行编码,因为它们最终设计得很好.特别是,我感兴趣java.time.Instant,并不是完全支持所有java.time.*类型,因为我的所有实体都将使用这个特定的类(或者我现在想,至少:-)

一种选择是编写类型转换器,如JPA 2.1所定义.但是,我们的应用服务器是JBoss EAP 6.3,它是JPA 2.0但不兼容2.1,所以现在这是不可能的.

下一个选项是使用Hibernate用户类型(关于在此处转换其他JSR-310类的博客文章).

有更好的选择吗?谢谢.

hibernate jpa jpa-2.0 java-8 java-time

16
推荐指数
3
解决办法
1万
查看次数