我正在忙着一个涉及k-最近邻回归的项目.我混合了数字和分类领域.分类值是序数(例如银行名称,帐户类型).数字类型,例如工资和年龄.还有一些二元类型(例如,男性,女性).
如何将分类值纳入KNN分析?
据我所知,人们不能简单地将每个分类字段映射到数字键(例如,银行1 = 1;银行2 = 2等),因此我需要一种更好的方法来使用分类字段.我听说可以使用二进制数 - 这是一种可行的方法吗?建议将不胜感激.
1)为表中的列提供默认值有什么优点和缺点?
2)此外,所有列都应具有默认值吗?我的意思是,这似乎是个好主意...为什么不呢?:)
非常感谢
使用bash,我想找到操作系统并通知用户.我试过了:
OS='uname -s'
echo "$OS"
if [ "$OS" == 'Linux' ]; then
echo "Linux"
else
echo "Not Linux"
fi
Run Code Online (Sandbox Code Playgroud)
我得到了
uname -s
Not Linux
Run Code Online (Sandbox Code Playgroud)
在终端上,这是错误的.如何正确设置字符串到uname返回的内容?
谢谢