小编mow*_*per的帖子

生成R中所有可能的行组合？

假设我有两个数据框,学生和老师.

students <- data.frame(name = c("John", "Mary", "Sue", "Mark", "Gordy", "Joey", "Marge", "Sheev", "Lisa"),
                   height = c(111, 93, 99, 107, 100, 123, 104, 80, 95),
                   smart = c("no", "no", "yes", "no", "yes", "yes", "no", "yes", "no"))
teachers <- data.frame(name = c("Ben", "Craig", "Mindy"),
                   height = c(130, 101, 105),
                   smart = c("yes", "yes", "yes"))

Run Code Online (Sandbox Code Playgroud)

我希望生成所有可能的学生和教师组合并保留随附的信息,基本上创建数据框"学生"和"教师"的所有行组合.这可以通过循环和cbind轻松完成,但对于大型数据帧,这需要永远.帮助一个R新手 - 最快的方法是什么？

编辑:如果这不清楚,我希望输出具有以下格式:

rbind(
  cbind(students[1, ], teachers[1, ]), 
  cbind(students[1, ], teachers[2, ]) 
  ...
  cbind(students[n, ], teachers[n, ]))

Run Code Online (Sandbox Code Playgroud)

mow*_*per

2017 08-04

5
推荐指数

1
解决办法

325
查看次数

如何使用 sklearn 并行拟合梯度提升模型？

使用 sklearn 构建模型相对较新。我知道交叉验证可以通过 n_jobs 参数进行并行化，但是如果我不使用 CV，我该如何利用我的可用内核来加速模型拟合？

python machine-learning scikit-learn

mow*_*per

lucky-day

5
推荐指数

1
解决办法

2018
查看次数

与xgboost并行线程？

根据其文档，xgboost具有n_jobs参数。但是，当我尝试设置n_jobs时，出现此错误：

TypeError: __init__() got an unexpected keyword argument 'n_jobs'

Run Code Online (Sandbox Code Playgroud)

对于其他一些参数（例如random_state）也存在同样的问题。我以为这可能是一个更新问题，但似乎我具有最新版本（0.6a2，随pip一起安装）。

对于我来说，重现该错误并不需要太多：

from xgboost import XGBClassifier 
estimator_xGBM = XGBClassifier(max_depth = 5, learning_rate = 0.05, n_estimators = 400, n_jobs = -1).fit(x_train)

Run Code Online (Sandbox Code Playgroud)

有任何想法吗？

python machine-learning xgboost

mow*_*per

2017 09-20

3
推荐指数

2
解决办法

5589
查看次数

如何在 R 中进行分类时间序列预测？

我已经在 R 中使用 ARIMA 进行了一些时间序列预测，它在给定一系列连续值的情况下预测未来时间点的值，但我不确定在处理分类值时如何进行时间序列预测。

鉴于 5 个人的晨衣程序的这些简单训练序列，我如何为 person6 的最后两个条目生成预测？

person1 <- c("underwear", "socks", "pants", "shirt", "tie", "shoes", "jacket")
person2 <- c("underwear", "pants",  "socks", "shirt", "tie", "jacket", "shoes")
person3 <- c("socks", "underwear",  "pants", "shirt", "tie", "shoes", "jacket")
person4 <- c("underwear", "socks", "shirt", "pants", "tie", "shoes", "jacket")
person5 <- c("underwear", "socks", "shirt", "tie", "pants", "jacket", "shoes")
person6 <- c("underwear", "socks", "pants", "shirt") # Predict next events

Run Code Online (Sandbox Code Playgroud)

提前致谢！

r time-series

mow*_*per

lucky-day

2
推荐指数

1
解决办法

1144
查看次数

如何只保留唯一的行而忽略一列？

如果我有这个数据：

df1 <- data.frame(name = c("apple", "apple", "apple", "orange", "orange"),
       ID = c(1, 2, 3, 4, 5),
       is_fruit = c("yes", "yes", "yes", "yes", "yes"))

Run Code Online (Sandbox Code Playgroud)

我只想保留唯一的行，但忽略该ID列，输出如下所示：

df2 <- data.frame(name = c("apple", "orange"),
       ID = c(1, 4),
       is_fruit = c("yes", "yes"))

df2
#    name ID is_fruit
#1  apple  1      yes
#2 orange  4      yes

Run Code Online (Sandbox Code Playgroud)

我怎样才能做到这一点，理想情况下dplyr？

r dplyr

mow*_*per

2017 09-16

1
推荐指数

1
解决办法

1158
查看次数