我试图将数据(银行)分成训练数据和测试数据.但我在某种程度上得到了一个错误.我怎么能解决这个问题?
train = bank[1:100, ]
test = bank[!train,]
Status.test =Status[!train]
glm.fit=glm(Status~Length+Right+Bottom+Top+Diagonal,data=bank,family=binomial,subset=train)
#Error in xj[i] : invalid subscript type 'list'
glm.probs=predict(glm.fit,test,type="response")
glm.pred=rep("genuine",100)
glm.pred[glm.probs>.5]="counterfeit"
table(glm.pred,test)##classification on training data
#Error in table(glm.pred, test) : all arguments must have the same length
Run Code Online (Sandbox Code Playgroud) 我想创建像下面这样的5*3数组,而不是明确地输入它.
[[1, 6, 11],
[2, 7, 12],
[3, 8, 13],
[4, 9, 14],
[5, 10, 15]]
Run Code Online (Sandbox Code Playgroud)
我用过以下代码.
np.arange(1, 16).T.reshape((5,3))
Run Code Online (Sandbox Code Playgroud)
但它表明
array([[ 1, 2, 3],
[ 4, 5, 6],
[ 7, 8, 9],
[10, 11, 12],
[13, 14, 15]])
Run Code Online (Sandbox Code Playgroud)
如何按升序排序数字,使其成为第一个数组?
为什么在聚类方法中使用调整的兰特指数 (ARI) 和归一化互信息 (NMI) 会比简单的测试分数(例如 MSE)产生更好的测量结果?我理解哪个点属于哪个聚类在聚类算法中很重要,并且标记是任意的。