假设我们有一个包含多个data.csv文件的文件夹,每个文件包含相同数量的变量,但每个变量包含不同的时间.R中有没有办法同时导入它们而不必单独导入它们?
我的问题是我有大约2000个数据文件要导入,只需使用代码就可以单独导入它们:
read.delim(file="filename", header=TRUE, sep="\t")
Run Code Online (Sandbox Code Playgroud)
不是很有效率.
我有一个类似于这个的大型数据框:
df <- data.frame(dive=factor(sample(c("dive1","dive2"),10,replace=TRUE)),speed=runif(10))
> df
dive speed
1 dive1 0.80668490
2 dive1 0.53349584
3 dive2 0.07571784
4 dive2 0.39518628
5 dive1 0.84557955
6 dive1 0.69121443
7 dive1 0.38124950
8 dive2 0.22536126
9 dive1 0.04704750
10 dive2 0.93561651
Run Code Online (Sandbox Code Playgroud)
我的目标是在另一列等于某个值时平均一列的值,并对所有值重复此值.即在上面的示例中,我想为列speed的每个唯一值返回列的平均值dive.所以当时dive==dive1,平均值speed是这个,依此类推dive.
我有一个data.frame,具有针对日期的多个时间序列向量:时间向量.我想绘制所有相关的矢量,垂直堆叠在具有相同X轴但具有唯一Y轴的单独图形上.与此类似的图表:
我的数据看起来像这样:
dt <- structure(list(DEPTH = c(156, 156.5, 157.4, 158.15, 158.8, 159.2,
159.75, 160.35, 160.85, 161.1, 161.6, 162.05, 162.5, 162.65,
163.15, 163.45, 163.55, 163.8, 163.65, 163.75, 163.8, 163.8,
163.75, 164.45, 164.8, 165.35, 165.65, 165.75, 166.1, 166.75,
167, 167.2, 167.65, 168, 168.8, 169.3, 169.7, 170.2, 170.65,
170.9, 171.45, 171.65, 172, 172.1, 172.25, 173, 173.4, 173.9,
174.2, 174.6, 175, 175.25, 175.45, 175.9, 176.25, 176.7, 177,
177.15, 177.5, 178, 178.5, 179.05, 179.2, 180.7, 181.05, 181.25,
181.5, 181.7, 182.1, 182.3, 182.35, 182.75, 183.1, 183.65, …Run Code Online (Sandbox Code Playgroud) 假设我有多个数据框,它们都有相同的矢量名称,我想cbind所有具有commmon模式的数据框.所以对于这3个数据帧:
df.1 <- data.frame(column1 = factor(sample(c("Male","Female"), 10, replace=TRUE)),
speed=runif(10))
df.2 <- data.frame(column1 = factor(sample(c("Male","Female"), 10, replace=TRUE)),
speed=runif(10))
df.3 <- data.frame(column1 = factor(sample(c("Male","Female"), 10, replace=TRUE)),
speed = runif(10))
Run Code Online (Sandbox Code Playgroud)
我希望rbind所有的东西都有共同的模式"df.*"
我尝试创建一个列表,然后使用以下方法创建一个数据框:
temp <- lapply(ls(pattern = "df.*"), get)
temp2<- as.data.frame(temp)
Run Code Online (Sandbox Code Playgroud)
然而,这仅产生6列的数据帧,有效地整合了整个事物而不是rbinding.
我想写一个循环来从一组已经存在的矩阵创建多个数据帧.我使用代码导入并创建了这些:
temp<-list.files(pattern="*.csv")
ddives <- lapply(temp, read.csv)
Run Code Online (Sandbox Code Playgroud)
所以'ddives'是我的一组csv文件.我现在想要使用循环版本的代码从每个中创建一个数据框:
d.dives1<- data.frame(ddives[1])
Run Code Online (Sandbox Code Playgroud) 我有一个包含多个列的数据框,其中一个(称为:drift.N)是一系列TRUE和FALSES.我如何将"TRUE"行与"FALSE"行分开,或者让R告诉我哪些行漂移.N =="TRUE"?