小编zx8*_*754的帖子

137
推荐指数
7
解决办法
9万
查看次数

将data.frame列转换为向量?

我有一个数据框,如:

a1 = c(1, 2, 3, 4, 5)
a2 = c(6, 7, 8, 9, 10)
a3 = c(11, 12, 13, 14, 15)
aframe = data.frame(a1, a2, a3)
Run Code Online (Sandbox Code Playgroud)

我尝试以下将其中一列转换为向量,但它不起作用:

avector <- as.vector(aframe['a2'])
class(avector) 
[1] "data.frame"
Run Code Online (Sandbox Code Playgroud)

这是我能提出的唯一解决方案,但我认为必须有更好的方法来做到这一点:

class(aframe['a2']) 
[1] "data.frame"
avector = c()
for(atmp in aframe['a2']) { avector <- atmp }
class(avector)
[1] "numeric"
Run Code Online (Sandbox Code Playgroud)

注意:我的上述词汇可能已关闭,如果是,请纠正我.我还在学习R的世界.另外,对这里发生的事情的任何解释都是值得赞赏的(即与Python或其他语言相关的内容会有所帮助!)

r vector type-conversion dataframe

136
推荐指数
9
解决办法
31万
查看次数

将data.frame列格式从字符转换为因子

我想将我的data.frame object(mydf)的某些列的格式(类)从charactor更改为factor.

当我按read.table()功能阅读文本文件时,我不想这样做.

任何帮助,将不胜感激.

r character dataframe r-faq

136
推荐指数
6
解决办法
31万
查看次数

如何计算目录的md5校验和?

我需要为*.py位于目录和所有子目录下的特定类型(例如)的所有文件计算摘要md5校验和.

最好的方法是什么?

编辑:建议的解决方案非常好,但这不是我需要的.我正在寻找一种解决方案,以获得单个摘要校验和,它将唯一地标识整个目录 - 包括其所有子目录的内容.

linux directory md5sum

129
推荐指数
6
解决办法
13万
查看次数

在运行install.packages()之前检查已安装的软件包

我有一个R脚本,与不同计算机上的多个用户共享.其中一行包含install.packages("xtable")命令.

问题是,每次有人运行脚本时,R都会花费大量时间显然重新安装软件包(实际上确实需要一些时间,因为实际案例中有几个软件包的向量).

如何首先检查软件包是否已安装,然后仅install.packages()针对那些软件包运行?

packages r

128
推荐指数
9
解决办法
14万
查看次数

如何将背景转换为透明?

我没有任何图像处理/编辑工具的经验.我正在做一个项目,要求我将背景颜色(红色/蓝色/白色)的图像(小图标)转换为网站透明.

例

目标是将红色背景转换为透明.

  1. 我应该考虑哪些图像编辑工具?
  2. 如何过滤背景颜色并使其透明?

image web

126
推荐指数
2
解决办法
37万
查看次数

grep使用具有多个模式的字符向量

我试图用来grep测试字符串向量是否存在于另一个向量中,并输出存在的值(匹配模式).

我有一个这样的数据框:

FirstName Letter   
Alex      A1
Alex      A6
Alex      A7
Bob       A1
Chris     A9
Chris     A6
Run Code Online (Sandbox Code Playgroud)

我有一个字符串模式的向量可以在"Letter"列中找到,例如:c("A1", "A9", "A6").

我想检查模式向量中的任何字符串是否出现在"Letter"列中.如果是,我想要输出唯一值.

问题是,我不知道如何使用grep多种模式.我试过了:

matches <- unique (
    grep("A1| A9 | A6", myfile$Letter, value=TRUE, fixed=TRUE)
)
Run Code Online (Sandbox Code Playgroud)

但它给了我0场比赛,这是不是真的,任何建议?

regex r

122
推荐指数
8
解决办法
19万
查看次数

从分组数据中选择第一行和最后一行

使用dplyr,如何在一个语句中选择分组数据的顶部和底部观察/行?

数据和示例

给定一个数据框架

df <- data.frame(id=c(1,1,1,2,2,2,3,3,3), 
                 stopId=c("a","b","c","a","b","c","a","b","c"), 
                 stopSequence=c(1,2,3,3,1,4,3,1,2))
Run Code Online (Sandbox Code Playgroud)

我可以使用每个组的顶部和底部观察结果slice,但使用两个单独的语句:

firstStop <- df %>%
  group_by(id) %>%
  arrange(stopSequence) %>%
  slice(1) %>%
  ungroup

lastStop <- df %>%
  group_by(id) %>%
  arrange(stopSequence) %>%
  slice(n()) %>%
  ungroup
Run Code Online (Sandbox Code Playgroud)

我可以将这两个statmenets合并成一个选择两个顶部和底部的意见?

r dplyr

120
推荐指数
7
解决办法
8万
查看次数

将函数应用于矩阵或数据框的每一行

假设我有一个by 2矩阵和一个函数,它将一个2向量作为其参数之一.我想将函数应用于矩阵的每一行并得到一个n向量.在R中如何做到这一点?

例如,我想在三个点上计算2D标准正态分布的密度:

bivariate.density(x = c(0, 0), mu = c(0, 0), sigma = c(1, 1), rho = 0){
    exp(-1/(2*(1-rho^2))*(x[1]^2/sigma[1]^2+x[2]^2/sigma[2]^2-2*rho*x[1]*x[2]/(sigma[1]*sigma[2]))) * 1/(2*pi*sigma[1]*sigma[2]*sqrt(1-rho^2))
}

out <- rbind(c(1, 2), c(3, 4), c(5, 6))
Run Code Online (Sandbox Code Playgroud)

如何将功能应用到每一行out

如何以指定的方式将除了点之外的其他参数的值传递给函数?

r function matrix apply sapply

114
推荐指数
5
解决办法
22万
查看次数

提取向量的每个第n个元素

我想创建一个向量,其中每个元素是i+6th另一个向量的元素.

例如,在长度为120的向量中,我想创建另一个长度为20的向量,其中每个元素是i, i+6, i+12, i+18...初始向量的值,即我想要提取原始的每个第6个元素.

r vector

114
推荐指数
3
解决办法
10万
查看次数