sklearn SelectKBest()中如何设置评分函数的参数

Ski*_*kip 5 python syntax class machine-learning scikit-learn

SelectKBest()在 sklearn 中使用该类进行特征选择。SelectKBest()可以将可调用的评分函数作为输入。在这种情况下,我想mutual_info_regression用作评分函数。mutual_info_regression可以带一些我想自己设置的参数。例如,我想设置random_state = 0. 问题是我不确定如何将参数传递给 score 函数,因为 score 函数本身就是SelectKBest(). 显然像这样的东西是SelectKBest(score_func = mutual_info_classif(random_state=0))行不通的,因为该mutal_info_classif函数会被直接调用。我觉得这可能是关于 python 类的一个非常基本的问题,但我似乎找不到任何解决我正在寻找的问题。在此先感谢您的时间!

Mik*_*bov 8

您可以创建另一个调用mutual_info_regression 的函数并传递它:

def my_score(X, y):
    return mutual_info_regression(X, y, random_state=0)

SelectKBest(score_func=my_score)
Run Code Online (Sandbox Code Playgroud)

Python 标准库为创建此类函数提供了一个有用的帮助程序——它被称为functools.partial。它允许创建带有一些预设参数的函数;您可以编写而不是“手动”my_score 定义

from functools import partial
my_score = partial(mutual_info_regression, random_state=0)
SelectKBest(score_func=my_score)
Run Code Online (Sandbox Code Playgroud)

当然,您也可以partial直接通过,这使您非常接近您的示例:

from functools import partial
SelectKBest(score_func=partial(mutual_info_classif, random_state=0))
Run Code Online (Sandbox Code Playgroud)