ero*_*gol 8 machine-learning scikit-learn
在我的问题中,我有非常大的数据集,这是我的记忆.我想通过使用像HDF5这样的磁盘数据来训练我的模型.sklearn是否支持此功能还是有其他选择吗?
ogr*_*sel 5
您要求的是称为核外或流式学习.只有scikit-learn模型的子集才能实现partial_fit增量拟合的方法.
partial_fit
文档中有一个例子.特别是在HDF5中的数据上没有特定的实用工具,但可以调整此示例以从任何外部数据源(例如本地磁盘上的HDF5数据或网络上的数据库)获取数据,例如使用pandas SQL适配器).
归档时间:
10 年,6 月 前
查看次数:
1204 次
最近记录: