小编Hen*_*rik的帖子

如何优雅地将Sklearn的GridseachCV的最佳参数传递给另一个模型？

我通过网格搜索CV为我的KNN估算器找到了一组最好的超参数:

>>> knn_gridsearch_model.best_params_
{'algorithm': 'auto', 'metric': 'manhattan', 'n_neighbors': 3}

Run Code Online (Sandbox Code Playgroud)

到现在为止还挺好.我想用这些新发现的参数训练我的最终估算器.有没有办法直接提供上面的超参数字典？我试过这个:

>>> new_knn_model = KNeighborsClassifier(knn_gridsearch_model.best_params_)

Run Code Online (Sandbox Code Playgroud)

但相反,希望的结果new_knn_model只是将整个字典作为模型的第一个参数,并将其余的作为默认值:

>>> knn_model
KNeighborsClassifier(algorithm='auto', leaf_size=30, metric='minkowski',
           metric_params=None, n_jobs=1,
           n_neighbors={'n_neighbors': 3, 'metric': 'manhattan', 'algorithm': 'auto'},
           p=2, weights='uniform')

Run Code Online (Sandbox Code Playgroud)

确实令人失望.

python machine-learning scikit-learn hyperparameters grid-search

Hen*_*rik

2017 07-13

12
推荐指数

2
解决办法

5502
查看次数

一键编码多级列数据

我有以下数据框，其中有关于不同主题的特征的记录：

ID   Feature
-------------------------
1    A
1    B
2    A
1    A
3    B
3    B
1    C
2    C
3    D

Run Code Online (Sandbox Code Playgroud)

我想获得另一个（聚合？）数据框，其中每一行代表一个特定的主题，并且有一个所有单热编码功能的详尽列表：

ID   FEATURE_A FEATURE_B FEATURE_C FEATURE D
--------------------------------------------
1    1         1         1         0
2    1         0         1         0
3    0         1         0         0

Run Code Online (Sandbox Code Playgroud)

它如何在 Python (Pandas) 中实现？

奖励：如何实现特征列包含出现次数而不仅仅是二进制标志的版本？

python encoding pandas

Hen*_*rik

lucky-day

11
推荐指数

1
解决办法

3049
查看次数

如何在Python中将多页PDF转换为图像对象列表？

我想将多页PDF文档转换为列表结构中的一系列图像对象，而无需在Python中将图像保存在磁盘中（我想使用PIL Image处理它们）。到目前为止，我只能这样做，首先将图像写入文件：

from wand.image import Image

with Image(filename='source.pdf') as img:

    with img.convert('png') as converted:
        converted.save(filename='pyout/page.png')

Run Code Online (Sandbox Code Playgroud)

但是如何将上面的img对象直接转换为PIL.Image对象列表？

python image image-processing wand

Hen*_*rik

lucky-day

5
推荐指数

2
解决办法

8226
查看次数

调整图像画布大小以保持Python,OpenCv中的方形纵横比

我想从任何输入图片中获取一张1000 x 1000的Python图片,这样输入就不会丢失它的宽高比.换句话说,我想调整输入的大小,使其较长的尺寸为1000像素,并用背景颜色"填充"另一个尺寸,直到它变为1000 x 1000平方.原件必须在最后的中心.

python opencv image-processing aspect-ratio

Hen*_*rik

2017 06-23

5
推荐指数

2
解决办法

7929
查看次数

如何在Python中将变量字符串插入多行注释中？

exec我想像这样定义一个Python函数：

exec """def my_func(alpha = 'a'):
  return alpha"""

Run Code Online (Sandbox Code Playgroud)

有用。alpha = 'a'但是，出于特定原因，我想在单独的字符串中定义：

s = "alpha = 'a'"
exec """def my_func(s):
  return alpha"""

Run Code Online (Sandbox Code Playgroud)

但这不起作用。有没有办法以这种方式将字符串变量内容插入到多行注释字符串中？

python comments

Hen*_*rik

lucky-day

0
推荐指数

1
解决办法

3651
查看次数

标签统计

python ×5

image-processing ×2

aspect-ratio ×1

comments ×1

encoding ×1

grid-search ×1

hyperparameters ×1

image ×1

machine-learning ×1

opencv ×1

pandas ×1

scikit-learn ×1

wand ×1

如何优雅地将Sklearn的GridseachCV的最佳参数传递给另一个模型？

一键编码多级列数据

如何在Python中将多页PDF转换为图像对象列表？

调整图像画布大小以保持Python,OpenCv中的方形纵横比

如何在Python中将变量字符串插入多行注释中？

标签 统计

小编Hen_rik的帖子

标签统计