小编osh*_*ibr的帖子

GridSearchCV - 每次迭代保存结果

我正在使用GridSearchCV,每次迭代后我想将clf.cv_results_属性保存到一个文件中(以防万一该过程在中间崩溃)。

我试图寻找解决方案,但我就是想不通。

任何帮助将不胜感激。

python machine-learning scikit-learn hyperparameters grid-search

6
推荐指数
1
解决办法
2603
查看次数

在Python中删除类似的文档

我有一个带有系列字幕的文件夹.我希望每集从文件夹中获取一个字幕文件.我的问题是,有些字幕在同一集中,但名称不同

/data/netfilx/reality_subtitle/Top Chef/Top.Chef-Texas.S09E02.720p.HDTV.x264-MOMENTUM.HI.srt
/data/netfilx/reality_subtitle/Top Chef/Top.Chef-Texas.902.720p.HDTV.x264.MOMENTUM.srt
/data/netfilx/reality_subtitle/Top Chef/Top.Chef-Texas.9X02.HDTV.XviD-MOMENTUM.HI.srt
/data/netfilx/reality_subtitle/Top Chef/Top.Chef-Texas.S09E02.HDTV.XviD-MOMENTUM.srt
Run Code Online (Sandbox Code Playgroud)

所以他们非常相似,但不是100%相同.

如何删除重复文档并保留仅使用不同的剧集字幕?
我会附上我尝试的但不幸的是我很无能......

python algorithm nlp

0
推荐指数
1
解决办法
93
查看次数