我是新手,但有一个问题:
我有一个包含15列和33,000行的数据集(csv文件)。
当我在Excel中查看数据时看起来不错,但是当我尝试将数据加载到R-studio时出现问题:
我使用了代码:
x <- read.csv(file = "1energy.csv", head = TRUE, sep="")
View(x)
Run Code Online (Sandbox Code Playgroud)
结果是列名很好,但是数据(第2行及以后的数据)都在我的第一列中。
在第一列中,数据用分隔。。但是当我尝试代码时:
x1 <- read.csv(file = "1energy.csv", head = TRUE, sep=";")
Run Code Online (Sandbox Code Playgroud)
下一个问题是:read.table中的错误(文件=文件,标头=标头,sep = sep,引用=引号,:不允许重复的“ row.names”
所以我做了代码:
x1 <- read.csv(file = "1energy.csv", head = TRUE, sep=";", row.names = NULL)
Run Code Online (Sandbox Code Playgroud)
看起来好像可以正常工作...。但是现在数据位于错误的列中(例如,“名称”列现在包含“时间”值,而“时间”列包含“成本”值)。
有人知道如何解决此问题吗?我可以重命名列,但我认为这不是最好的方法。
Name Passage growth
P1.X.1 1 42036
P1.X.1 2 42036
P1.X.1 3 42036
P1.X.2 1 42036
P1.X.2 2 42036
P1.X.2 3 42036
P1.X.3 1 42036
P1.X.3 2 42036
P1.X.3 3 42036
P1.X.4 1 42036
P1.X.4 2 42036
P1.X.4 3 42036
P1.X.1 1 42036
P1.X.1 2 42036
P1.X.1 3 42036
P1.X.2 1 42036
P1.X.2 2 42036
P1.X.2 3 42036
P1.X.3 1 42036
P1.X.3 2 42036
P1.X.3 3 42036
P1.X.4 1 42036
P1.X.4 2 42036
P1.X.4 3 42036
P.Plot <- qplot(aes(y = as.numeric(D.Subset$growth)), …Run Code Online (Sandbox Code Playgroud) 我有一个矢量
x <- c(1,2,5,4,3,1,1,4,2,6,7,2,4,1,5)
,我想添加相同的值,给我新的矢量
x <- c(4, 6, 3, 12, 10, 6, 7)
这听起来很简单,但我卡住了.
我正在尝试为使用 ggplot2 制作的复合图表生成一个很好的图例,其中有一个躲避的条形图和一条水平线,用于显示土壤中钡的参考值。问题是 hline 图例的特征也“污染”了条形图。我已经看到类似的主题试图调整提出的其他解决方案,但没有任何显着结果。
这是我的例子:
数据框:
Position Year Value
Position 1 1999 12
Position 2 1999 14
Position 3 1999 15
Position 1 2000 13
Position 2 2000 11
Position 3 2000 21
Position 1 2001 12
Position 2 2001 13
Position 3 2001 16
Run Code Online (Sandbox Code Playgroud)
编码:
ggplot(input, aes(fill=Year , x=Position, y=Value)) +
geom_bar(stat="identity",
position="dodge", size=0.1, width=0.5, show.legend=TRUE) +
labs(title="Barium concentration in the soil") +
xlab("Samples") +
ylab("Concentration in ng/kg") +
scale_y_continuous(limits = c(0, 30)) +
#color of barplot
scale_fill_manual(values=c("grey40", …Run Code Online (Sandbox Code Playgroud) Hello Stackoverflow用户,
我对R中的聚合函数的结果有一个问题.我的目的是从数据集中选择某些鸟类,并计算被调查区域内观察到的个体的密度.为此,我获取了主数据文件的一个子集,然后在区域上聚合,计算平均值和个体数量(由向量长度表示).然后我想用计算出的平均面积和个体数来计算密度.那没用.我使用的代码如下:
> head(data)
positionmonth positionyear quadrant Species Code sum_areainkm2
1 5 2014 1 Bar-tailed Godwit 5340 155.6562
2 5 2014 1 Bar-tailed Godwit 5340 155.6562
3 5 2014 1 Bar-tailed Godwit 5340 155.6562
4 5 2014 1 Bar-tailed Godwit 5340 155.6562
5 5 2014 1 Gannet 710 155.6562
6 5 2014 1 Bar-tailed Godwit 5340 155.6562
sub.gannet<-subset(data, species == "Gannet")
sub.gannet<-data.frame(sub.gannet)
x<-sub.gannet
aggr.gannet<-aggregate(sub.gannet$sum_areainkm2, by=list(sub.gannet$positionyear, sub.gannet$positionmonth, sub.gannet$quadrant, sub.gannet$Species, sub.gannet$Code), FUN=function(x) c(observed_area=mean(x), NoInd=length(x)))
names(aggr.gannet)<-c("positionyear", "positionmonth", "quadrant", "species", "code", "x")
aggr.gannet<-data.frame(aggr.gannet) …Run Code Online (Sandbox Code Playgroud) 所以我有这些数据
10 21 22 23 23 43
20 12 26 43 23 65
21 54 64 73 25 75
Run Code Online (Sandbox Code Playgroud)
我的预期结果是:
142
189
312
Run Code Online (Sandbox Code Playgroud)
我试着用:
df = data.matrix(df)
df = colSums(df)
df = as.data.frame(df)
Run Code Online (Sandbox Code Playgroud)
但是,值的总和是错误的.我想知道如何改进或纠正这个解决方案?