似乎有很多与机器学习相关的子领域。是否有一本书或博客概述了这些不同的领域以及每个领域的工作,也许如何开始,以及需要哪些背景知识?
有人能解释数据挖掘中分类和聚类之间的区别吗?
如果可以,请举两个例子来理解主要想法.
terminology classification cluster-analysis machine-learning data-mining
我注意到,当在特定数据集(矩阵)上使用One Hot编码并将其用作学习算法的训练数据时,与使用原始矩阵本身作为训练数据相比,它在预测准确性方面提供了明显更好的结果.这种性能提升如何发生?
期望最大化如果采用一种概率方法对数据进行分类.如果我错了,请纠正我,如果它不是分类器.
这种EM技术的直观解释是什么?这里的期望是什么,最大化的是什么?
cluster-analysis machine-learning mathematical-optimization data-mining expectation-maximization
当我们计算考虑精度和召回的F-测量时,我们采用两个测量的调和平均值而不是简单的算术平均值.
采用调和均值而不是简单平均值的直观原因是什么?
可能重复:
最佳地聚类一维数据?
所以,假设我有一个这样的数组:
[1,1,2,3,10,11,13,67,71]
Run Code Online (Sandbox Code Playgroud)
有没有一种方便的方法将数组分区为这样的东西?
[[1,1,2,3],[10,11,13],[67,71]]
Run Code Online (Sandbox Code Playgroud)
我查看了类似的问题,但是大多数人建议使用k-means来聚集点,比如scipy,这对像我这样的初学者来说非常混乱.另外我认为k-means更适合两维或更多维聚类吧?有没有办法根据数字将N个数组分组到多个分区/聚类?
有些人还提出了严格的范围分区,但并不总是按预期呈现结果
arrays cluster-analysis data-mining dimension partition-problem
我理解Gradient Descent的作用.基本上它试图通过缓慢向下移动曲线来向局部最优解.我想了解计划梯度下降和牛顿方法之间的实际差异是什么?
从维基百科,我读了这条短线"牛顿的方法使用曲率信息来采取更直接的路线." 这直觉意味着什么?
machine-learning mathematical-optimization data-mining newtons-method gradient-descent