小编Mil*_*ros的帖子

Python,机器学习-对自定义验证集执行网格搜索

我正在处理一个不平衡的分类问题,我的否定类比我的肯定类多1000倍。我的策略是在平衡(50/50比率)训练集(我有足够的模拟样本)上训练深度神经网络,然后使用不平衡(1/1000比率)验证集选择最佳模型并优化超参数。

由于参数数量很大,因此我想使用scikit-learn RandomizedSearchCV,即随机网格搜索。

据我了解,sk-learn GridSearch在训练集上应用了一个指标,以选择最佳的超参数集。但是,在我的情况下,这意味着GridSearch将选择对均衡训练集而不是对更现实的不均衡数据表现最佳的模型。

我的问题是:有没有一种方法可以对在特定的,用户定义的验证集上估算的性能进行网格搜索?

python validation machine-learning scikit-learn grid-search

2
推荐指数
1
解决办法
1900
查看次数