我无法理解逻辑(布尔)值的属性TRUE,FALSE以及NA与逻辑OR(|)和逻辑AND(&)一起使用时.这里有些例子:
NA | TRUE
# [1] TRUE
NA | FALSE
# [1] NA
NA & TRUE
# [1] NA
NA & FALSE
# [1] FALSE
Run Code Online (Sandbox Code Playgroud)
你能解释一下这些输出吗?
docs.ggplot2.org目前提供的功能文档非常少ggplotGrob.在洛桑联邦理工学院的网站是一点点更多的信息,但它仍然不是非常有帮助.
您能否提供一个关于该功能可以做什么的简短教程ggplotGrob?
考虑以下
d = data.frame(y=rnorm(120),
x=rep(c("bar", "long category name", "foo"), each=40))
ggplot(d,aes(x=x,y=y)) +
geom_boxplot() +
theme(axis.text.x=element_text(size=15, angle=90))
Run Code Online (Sandbox Code Playgroud)
x轴标签由标签的中心对齐.是否可以在右侧自动对齐,以便每个标签都在图表的正下方?
我使用zip命令行和-r选项在Mac OSX上压缩了一个目录.我scp是.zip
在Linux上运行的集群.
如果我尝试解压缩.zip与
tar -vxzf foo.zip
在我的机器上它工作.但是相同的命令在群集上不起作用.我收到了错误
gzip: stdin has more than one entry--rest ignored
tar: Child returned status 2
tar: Error is not recoverable: exiting now
Run Code Online (Sandbox Code Playgroud)
我该如何解决这个问题?
例如,考虑使用数据mtcars和函数的该图coord_flip
library(ggplot2)
library(Hmisc)
ggplot(mtcars,aes(x=gear,y=cyl)) + stat_summary(aes(color=as.factor(rep(1:2,16))),
fun.data=mean_cl_boot, position=position_dodge(0.4)) + coord_flip()
Run Code Online (Sandbox Code Playgroud)
错误栏在图表上是水平但在图例中垂直的事实困扰我:)我如何旋转这些符号?
在一个文件夹中,我想打印.txt包含n=27行或更少行的每个文件的名称.我可以
wc -l *.txt | awk '{if ($1 <= 27){print}}'
Run Code Online (Sandbox Code Playgroud)
问题是该文件夹中的许多文件是数百万行(并且行很长),因此命令wc -l *.txt非常慢.原则上,进程可以计算行数,直到找到至少n行,然后继续下一个文件.
什么是更快的替代方案?
仅供参考,我在 MAC OSX 10.11.6
这是一次尝试 awk
#!/bin/awk -f
function printPreviousFileIfNeeded(previousNbLines, previousFILENAME)
{
if (previousNbLines <= n)
{
print previousNbLines": "previousFILENAME
}
}
BEGIN{
previousNbLines=n+1
previousFILENAME=NA
}
{
if (FNR==1)
{
printPreviousFileIfNeeded(previousNbLines, previousFILENAME)
previousFILENAME=FILENAME
}
previousNbLines=FNR
if (FNR > n)
{
nextfile
}
}
END{
printPreviousFileIfNeeded(previousNbLines, previousFILENAME)
}
Run Code Online (Sandbox Code Playgroud)
可称为
awk -v n=27 -f myAwk.awk *.txt
Run Code Online (Sandbox Code Playgroud)
但是,代码在打印完全空文件时失败.我不知道如何解决这个问题,我不确定我的awk脚本是否可行.
考虑一个x在min和之间有界的有序向量max.下面是这样一个例子x,其中min可能是0与max可能是12:
x = c(0.012, 1, exp(1), exp(1)+1e-55, exp(1)+1e-10,
exp(1)+1e-3, 3.3, 3.33333, 3.333333333333333, 3+1/3, 5, 5, 10, 12)
Run Code Online (Sandbox Code Playgroud)
5和5以及exp(1)和exp(1)+10^(-55)具有完全相同的值(到浮点数的精度水平).其他一些条目差别很大,其他一些条款只有少量不同.我想考虑一下等式测试的近似值
ApproxEqual = function(a,b) abs(a-b) < epsilon
Run Code Online (Sandbox Code Playgroud)
,例如,epsilon可能在哪里1e-5.
目标
我想修改变量的值x"尽可能少",以确保没有两个值x"近似相等"并且x仍然在min和之间max.
我很高兴让你决定"尽可能少"的意思.例如,可以最小化原始x变量输出和预期变量输出之间的平方偏差之和.
例1
x_input = c(5, 5.1, 5.1, 5.1, 5.2)
min=1
max=100
x_output = c(5, …Run Code Online (Sandbox Code Playgroud) 我只有非常基本的 Python 经验。我正在尝试安装该软件包pyslim(请参阅pypi 网站上的此处)。我做了
$ pip install pyslim
Requirement already satisfied: pyslim in ./Library/Python/2.7/lib/python/site-packages/pyslim-0.1-py2.7.egg (0.1)
Requirement already satisfied: msprime in /usr/local/lib/python2.7/site-packages (from pyslim) (0.6.1)
Requirement already satisfied: attrs in /usr/local/lib/python2.7/site-packages (from pyslim) (16.3.0)
Requirement already satisfied: svgwrite in /usr/local/lib/python2.7/site-packages (from msprime->pyslim) (1.1.12)
Requirement already satisfied: jsonschema in /usr/local/lib/python2.7/site-packages (from msprime->pyslim) (2.6.0)
Requirement already satisfied: six in /usr/local/lib/python2.7/site-packages (from msprime->pyslim) (1.10.0)
Requirement already satisfied: numpy>=1.7.0 in /usr/local/lib/python2.7/site-packages/numpy-1.10.4-py2.7-macosx-10.11-x86_64.egg (from msprime->pyslim) (1.10.4)
Requirement already satisfied: h5py in /usr/local/lib/python2.7/site-packages (from …Run Code Online (Sandbox Code Playgroud) 我正在尝试将拟合的二次曲线添加到绘图中.
abline(lm(data~factor+I(factor^2)))
Run Code Online (Sandbox Code Playgroud)
显示的回归是线性的而不是二次的,我得到这样的信息:
Message d'avis:在abline(lm(data~factor + I(factor ^ 2)),col = palette [iteration]):利用des deux premiers des 3 systemsderégression
意思是:
使用3个回归系数中的前2个
当只运行该lm()功能时,我没有收到任何消息.
这是一个示例数据:
factor <- 1:7
data <- c(0.1375000,0.2500000,0.3416667,0.4583333,0.7250000,0.9166667,1.0000000)
Run Code Online (Sandbox Code Playgroud) 这是一些数据和情节:
set.seed(18)
data = data.frame(y=c(rep(0:1,3),rnorm(18,mean=0.5,sd=0.1)),colour=rep(1:2,12),x=rep(1:4,each=6))
ggplot(data,aes(x=x,y=y,colour=factor(colour)))+geom_point()+ geom_smooth(method='lm',formula=y~x,se=F)
Run Code Online (Sandbox Code Playgroud)

如您所见,线性回归受x = 1的值的影响很大.我可以获得针对x> = 2计算的线性回归,但显示x = 1的值(y等于0或1).除线性回归外,结果图将完全相同.他们不会"受"这些值对abscisse = 1的影响