我从statmethods [dot] net借用了这段代码.结果是正态分布下的彩色区域.
mean=100; sd=15
lb=80; ub=120
x <- seq(-4,4,length=100)*sd + mean
hx <- dnorm(x,mean,sd)
plot(x, hx, type="n", xlab="IQ Values", ylab="Density",
main="Normal Distribution", axes=FALSE)
i <- x >= lb & x <= ub
lines(x, hx)
polygon(c(lb,x[i],ub), c(0,hx[i],0), col="red")
area <- pnorm(ub, mean, sd) - pnorm(lb, mean, sd)
result <- paste("P(",lb,"< IQ <",ub,") =",
signif(area, digits=3))
mtext(result,2)
Run Code Online (Sandbox Code Playgroud)

我想知道是否可以选择图像作为红色多边形的颜色?
非常感谢!
我是一个热心的R新手,需要一些帮助!:)
我有一个如下所示的数据框:
id<-c(100,200,300,400)
a<-c(1,1,0,1)
b<-c(1,0,1,0)
c<-c(0,0,1,1)
y=data.frame(id=id,a=a,b=b,c=c)
Run Code Online (Sandbox Code Playgroud)
其中id是唯一标识符(例如人),a,b和c是该人是否具有此特征的虚拟变量(始终为1 = TRUE).
我希望R创建一个矩阵或数据框,其中我将变量a,b和c都作为列和行的名称.对于矩阵的值,R必须计算具有此特征的标识符的数量或特征的组合.
因此,例如,ID 100,200和400具有在矩阵的对角线中的特征a,其中a和交叉,R将输入3.仅ID 100具有特征a和b,因此R将输入1,其中a和b交叉,等等.
生成的数据框必须如下所示:
l<-c("","a","b","c")
m<-c("a",3,1,1)
n<-c("b",1,2,1)
o<-c("c",1,1,2)
result<-matrix(c(l,m,n,o),nrow=4,ncol=4)
Run Code Online (Sandbox Code Playgroud)
由于我的数据集有10个变量和数百个观察,我将不得不自动完成整个过程.
对你的帮助表示感谢.非常感谢!
从诸如
s <- c("123 John 80 kg", "456 Paul 23 shifts 9 l", "Diane 155 cm")
Run Code Online (Sandbox Code Playgroud)
我只希望提取最后的数字和结尾的文本。我想要的结果如下所示:
"80 kg" "9 l" "155 cm"
Run Code Online (Sandbox Code Playgroud) 我有一张表,其中一个变量是注册国家.
table(df$reg_country)
Run Code Online (Sandbox Code Playgroud)
收益:
AR BR ES FR IT
123 202 578 642 263
Run Code Online (Sandbox Code Playgroud)
现在,如果我将原始表格分组以排除其中一个国家/地区
df_subset<-subset(df, reg_country!='AR')
table(df_subset$reg_country)
Run Code Online (Sandbox Code Playgroud)
收益:
AR BR ES FR IT
0 202 578 642 263
Run Code Online (Sandbox Code Playgroud)
第二个结果对我来说非常令人惊讶,因为R似乎神奇地知道我已经从AR中删除了条目.
为什么会这样?
它是否会影响第二个数据框(df_subset)的大小?如果"是" - 是否有更有效的方法来进行子集以最小化尺寸?