使用dplyr和R中的摘要向每行添加哈希

Question

使用dplyr和R中的摘要向每行添加哈希

我需要向数据集中的每一行添加一个指纹，以便与同一组的更高版本进行检查以寻找差异。

我知道如何为R中的每一行添加哈希，如下所示：

data.frame(iris,hash=apply(iris,1,digest))

Run Code Online (Sandbox Code Playgroud)

我正在学习使用，dplyr因为数据集越来越大，我需要将它们存储在SQL Server中，我尝试了以下类似操作，但是哈希无法正常工作，所有行都提供相同的哈希值：

iris %>%
  rowwise() %>%
  mutate(hash=digest(.))

Run Code Online (Sandbox Code Playgroud)

关于使用dplyr进行逐行哈希处理的任何线索？谢谢！

Answer 1

akr*_*run 5

我们可以使用 do

res <- iris %>%
         rowwise() %>% 
         do(data.frame(., hash = digest(.)))
head(res, 3)
# A tibble: 3 x 6
#   Sepal.Length Sepal.Width Petal.Length Petal.Width Species                             hash
#         <dbl>       <dbl>        <dbl>       <dbl>  <fctr>                            <chr>
#1          5.1         3.5          1.4         0.2  setosa e261621c90a9887a85d70aa460127c78
#2          4.9         3.0          1.4         0.2  setosa 7bf67322858048d82e19adb6399ef7a4
#3          4.7         3.2          1.3         0.2  setosa c20f3ee03573aed5929940a29e07a8bb

Run Code Online (Sandbox Code Playgroud)

请注意，在该apply过程中，所有列都将转换为一个类，因为apply转换为，matrix而矩阵只能容纳一个类。有关将转换factor为character类的警告

归档时间：	8 年，1 月前
查看次数：	602 次
最近记录：	8 年，1 月前