我正在研究一种自动化 ML(回归)算法,其流程为:用户上传数据 -- 数据清理 -- 编码(目标编码器) -- 拟合模型 -- 结果。
到目前为止我完全没问题,我的困惑是当用户想要在没有目标变量的看不见的数据中测试它时,然后我需要再次执行数据清理 -我在拟合模型时使用的编码和编码技术只能工作如果存在目标变量(看不见的数据不会有目标变量),并且我无法更改看不见的数据的编码技术,因为测试数据需要经历与根据我的知识拟合模型时使用的数据相同的过程。
有人可以帮助我找到解决这个问题的方法吗?或者任何建议都会有很大帮助。
提前致谢。
arrays ×1
encoding ×1
json ×1
prediction ×1
python ×1
snowflake-cloud-data-platform ×1
sql ×1
test-data ×1