小编Har*_*ula的帖子

我们如何在dask分布式中为每个工作人员选择--nthreads和--nprocs?

我们如何在Dask分布式中为每个工作人员选择--nthreads和--nprocs?我有3个工作线程,每个工作线程有2个线程,每个内核有4个内核,每个内核有1个线程(根据每个工作线程上'lscpu'Linux命令的输出)

distributed-computing dask dask-distributed

8
推荐指数
1
解决办法
1384
查看次数

我们应该在 featuretools 中从 DFS 中排除目标变量吗?

在将数据帧作为实体集中的实体传递并在其上使用 DFS 时,我们是否应该从 DFS 中排除目标变量?在手动尝试传统特征选择方法并使用特征工具查看它是否提高了分数后,我有一个模型的 roc_auc 分数为 0.76。所以在包含目标变量的实体集上使用了 DFS。令人惊讶的是,roc_auc 分数上升到 0.996,准确度上升到 0.9997,所以我对分数表示怀疑,因为我将目标变量也传递到深度特征合成中,并且与目标相关的信息可能已泄露到训练中?我假设正确吗?

featuretools

3
推荐指数
2
解决办法
1086
查看次数