小编Gre*_*reg的帖子

使用dplyr和扫帚计算训练和测试集上的kmeans

我正在使用dplyr和扫帚为我的数据计算kmeans.我的数据包含X和Y坐标的测试和训练集,并按一些参数值(在本例中为lambda)分组:

mds.test = data.frame()
for(l in seq(0.1, 0.9, by=0.2)) {
  new.dist <- run.distance.model(x, y, lambda=l)
  mds <- preform.mds(new.dist, ndim=2)
  mds.test <- rbind(mds.test, cbind(mds$space, design[,c(1,3,4,5)], lambda=rep(l, nrow(mds$space)), data="test"))
}

> head(mds.test)
                        Comp1       Comp2 Transcripts Genes Timepoint Run lambda data
7A_0_AAGCCTAGCGAC -0.06690476 -0.25519106       68125  9324     Day 0  7A    0.1 test
7A_0_AAATGACTGGCC -0.15292848  0.04310200       28443  6746     Day 0  7A    0.1 test
7A_0_CATCTCGTTCTA -0.12529445  0.13022908       27360  6318     Day 0  7A    0.1 test
7A_0_ACCGGCACATTC -0.33015913  0.14647857       23038  5709     Day 0  7A    0.1 test
7A_0_TATGTCGGAATG -0.25826098 …
Run Code Online (Sandbox Code Playgroud)

r k-means dplyr broom

9
推荐指数
1
解决办法
522
查看次数

在时间轴上设置休息间隔

首先让我们创建一些示例数据。时间使用lubridate's存储,hm因为这似乎最合适。

library(tibble)
library(lubridate)
#> 
#> Attaching package: 'lubridate'
#> The following object is masked from 'package:base':
#> 
#>     date

(
  data <- tibble(
    Time = hm('09:00', '10:30'),
    Value = 1
  )
)
#> # A tibble: 2 x 2
#>   Time         Value
#>   <S4: Period> <dbl>
#> 1 9H 0M 0S         1
#> 2 10H 30M 0S       1
Run Code Online (Sandbox Code Playgroud)

这是我希望情节的样子。现在,我已经以半小时为间隔手动指定了休息时间。

library(ggplot2)
library(scales)

ggplot(data, aes(Time, Value)) +
  geom_point() +
  scale_x_time(breaks = hm('09:00', '09:30', '10:00', '10:30'))
Run Code Online (Sandbox Code Playgroud)

我想每隔半小时自动创建这些休息时间。尝试使用scales::date_breaks …

r ggplot2 lubridate

6
推荐指数
2
解决办法
3973
查看次数

purrr:将 %in% 与列表列一起使用

我有一列问题responses 和一列可能correct_answers。我想创建第三个(逻辑)列 ( correct) 来显示响应是否与可能的正确答案之一匹配。

我想我可能需要使用 purrr 函数,但我不确定如何将其中一个map函数与一起使用%in%

library(tibble)
library(dplyr)
#> 
#> Attaching package: 'dplyr'
#> The following objects are masked from 'package:stats':
#> 
#>     filter, lag
#> The following objects are masked from 'package:base':
#> 
#>     intersect, setdiff, setequal, union
library(purrr)

data <- tibble(
  response = c('a', 'b', 'c'),
  correct_answers = rep(list(c('a', 'b')), 3)
)

# works but correct answers specified manually
data %>%
  mutate(correct = response %in% c('a', 'b')) …
Run Code Online (Sandbox Code Playgroud)

r dplyr purrr

1
推荐指数
1
解决办法
99
查看次数

标签 统计

r ×3

dplyr ×2

broom ×1

ggplot2 ×1

k-means ×1

lubridate ×1

purrr ×1