小编SMR*_*SMR的帖子

基于目标变量的编码技术预测未见数据

我正在研究一种自动化 ML(回归)算法,其流程为:用户上传数据 -- 数据清理 -- 编码(目标编码器) -- 拟合模型 -- 结果。

到目前为止我完全没问题,我的困惑是当用户想要在没有目标变量的看不见的数据中测试它时,然后我需要再次执行数据清理 -我在拟合模型时使用的编码和编码技术只能工作如果存在目标变量(看不见的数据不会有目标变量),并且我无法更改看不见的数据的编码技术,因为测试数据需要经历与根据我的知识拟合模型时使用的数据相同的过程。

有人可以帮助我找到解决这个问题的方法吗?或者任何建议都会有很大帮助。

提前致谢。

python encoding test-data machine-learning prediction

6
推荐指数
1
解决办法
2024
查看次数

将 JSON 值列表分解为 SNOWFLAKE 数据库表中的行

我有一个如下屏幕截图所示的表,它基本上是一个 JSON,并被解析以获取下面的输出,现在我希望将 City 和 order 列中的值列表拆分为行。

有人可以帮我吗

在此输入图像描述

期望的输出如下

在此输入图像描述

sql arrays json snowflake-cloud-data-platform

5
推荐指数
1
解决办法
3695
查看次数