我有一个名为的数据集spam,其中包含58个列和大约3500行与垃圾邮件相关的数据.
我打算将来在这个数据集上运行一些线性回归,但我想事先做一些预处理,并将列标准化为零均值和单位方差.
我被告知最好的方法是使用R,所以我想问一下如何用R实现规范化?我已经正确加载了数据,我只是在寻找一些包或方法来执行此任务.
这是我的数字矩阵的摘录
[1,] 30 -33.129487 3894754.1 -39.701738 -38.356477 -34.220534
[2,] 29 -44.289487 -8217525.9 -44.801738 -47.946477 -41.020534
[3,] 28 -48.439487 -4572815.9 -49.181738 -48.086477 -46.110534
[4,] 27 -48.359487 -2454575.9 -42.031738 -43.706477 -43.900534
[5,] 26 -38.919487 -2157535.9 -47.881738 -43.576477 -46.330534
[6,] 25 -45.069487 -5122485.9 -47.831738 -47.156477 -42.860534
[7,] 24 -46.207487 -2336325.9 -53.131738 -50.576477 -50.410534
[8,] 23 -51.127487 -2637685.9 -43.121738 -47.336477 -47.040534
[9,] 22 -45.645487 3700424.1 -56.151738 -47.396477 -50.720534
[10,] 21 -56.739487 1572594.1 -49.831738 -54.386577 -52.470534
[11,] 20 -46.319487 642214.1 -39.631738 -44.406577 -41.490534
Run Code Online (Sandbox Code Playgroud)
我现在要做的是将每列的值缩放为0到1的值.
我尝试使用 …