我知道我可以实现这样的均方根误差函数:
def rmse(predictions, targets):
return np.sqrt(((predictions - targets) ** 2).mean())
Run Code Online (Sandbox Code Playgroud)
如果这个rmse函数在某个库中实现,可能是scipy或scikit-learn,我正在寻找什么?
在他们的文章的第3.4节中,作者解释了他们在搜索树木生长的最佳候选分割时如何处理缺失值.具体来说,它们为那些节点创建默认方向,作为拆分特征,在当前实例集中具有缺失值的节点.在预测时,如果预测路径经过该节点并且缺少特征值,则遵循默认方向.
然而,当缺少特征值并且节点没有默认方向时,预测阶段将会中断(并且这可能在许多情况下发生).换句话说,他们如何将默认方向与所有节点相关联,甚至是那些在训练时设置的活动实例中具有无缺失分裂功能的节点?
感觉应该有一种方法可以使用 pandas 的to_excel函数或XLSXwriter模块将 .xlsx 文件保存为只读文件。
我在没有运气的情况下查看了两个文档。
to_excel: https://pandas.pydata.org/pandasdocs/stable/generated/pandas.DataFrame.to_excel.html
XLSXwriter:http : //xlsxwriter.readthedocs.io/workbook.html
有没有另一种方法可以在熊猫中实现这一目标?
python ×2
candidate ×1
missing-data ×1
pandas ×1
python-2.7 ×1
python-3.x ×1
scikit-learn ×1
scipy ×1
search ×1
split ×1
xgboost ×1
xlsxwriter ×1