我想在直方图上展示去除异常值的效果,所以我必须将两个直方图绘制在一起。
boxplot(Costs, Costs1,
xlab=" Costs and Costs after removig outliers",
col=topo.colors(2))
Run Code Online (Sandbox Code Playgroud)
所以我试过这个:
hist(Costs,Costs1,main="Histogram of Maintenance_cost ",col="blue",
border="darkblue",xlab="Total_cost",ylab=" ",yaxt = 'n',
#ylim=c(0,3000),
#xlim=c(0,max(My_Costs)),
breaks=60)
Run Code Online (Sandbox Code Playgroud)
第一个代码给了我箱线图,但我尝试了它,它不起作用谁能告诉我如何在 R 中做到这一点?
我想根据该 ID 本身的前几年组的值在组变量中填充我的数据集的 NA。该na.locf(newData, na.rm = TRUE)部分代码不能正常工作。我认为这是因为输入不是数字。或者是另一回事?有谁知道如何解决这个问题?
for (i in my_data$ID){
newData = my_data[my_data$ID==i,c('ID','Year', 'group')][3]
na.locf(newData,na.rm = TRUE)
}
Run Code Online (Sandbox Code Playgroud)
我的数据集非常大。但我提供了这个作为我需要的样本:
structure(list(ID = c(1L, 2L, 3L, 1L, 1L, 1L), Year = c(2000L,
2000L, 2001L, 2001L, 2002L, 2003L), Group = structure(c(2L, 3L,
2L, 1L, 1L, 4L), .Label = c("", "\"A\"", "\"B\"", "\"C\""), class = "factor")), row.names = c(NA,
6L), class = "data.frame")
Run Code Online (Sandbox Code Playgroud)
结果应该是这样的:
structure(list(ID = c(1L, 1L, 1L, 1L, 2L, 2L), Year = c(2000L,
2001L, 2002L, 2003L, 2000L, 2002L), Group …Run Code Online (Sandbox Code Playgroud)