标签: data-mining

线性回归和逻辑回归有什么区别?

当我们必须预测分类(或离散)结果的值时,我们使用逻辑回归.我相信我们使用线性回归来预测输入值给出的结果值.

那么,这两种方法有什么区别?

machine-learning data-mining linear-regression

211
推荐指数
7
解决办法
21万
查看次数

被机器学习淹没 - 有 ML101 的书吗?

似乎有很多与机器学习相关的子领域。是否有一本书或博客概述了这些不同的领域以及每个领域的工作,也许如何开始,以及需要哪些背景知识?

machine-learning data-mining

207
推荐指数
8
解决办法
3万
查看次数

数据挖掘中的分类和聚类之间的区别?

有人能解释数据挖掘中分类和聚类之间的区别吗?

如果可以,请举两个例子来理解主要想法.

terminology classification cluster-analysis machine-learning data-mining

191
推荐指数
7
解决办法
22万
查看次数

有人可以用一种非常简单的图形方式给出余弦相似性的例子吗?

维基百科上的Cosine Similarity文章

你能在这里(列表或其他东西)显示向量然后进行数学运算,让我们看看它是如何工作的?

我是初学者.

text data-mining cosine-similarity

190
推荐指数
7
解决办法
14万
查看次数

亚马逊推荐功能如何运作?

亚马逊推荐技术的屏幕背后有什么技术?我相信亚马逊推荐目前是市场上最好的,但他们如何为我们提供这样的相关建议?

最近,我们参与了类似的推荐项目,但肯定希望从技术角度了解亚马逊推荐技术的来龙去脉.

任何投入都将受到高度赞赏.

更新:

专利解释了如何完成个性化建议,但它不是非常技术性的,因此如果可以提供一些见解,那将是非常好的.

根据Dave的评论,亲和力分析构成了此类推荐引擎的基础.这里还有一些关于主题的好读物

  1. 揭开市场篮子分析的神秘面纱
  2. 市场篮子分析
  3. 亲和力分析

推荐阅读:

  1. 数据挖掘:概念与技术

language-agnostic algorithm data-mining

142
推荐指数
4
解决办法
9万
查看次数

为什么一个热门编码可以提高机器学习性能?

我注意到,当在特定数据集(矩阵)上使用One Hot编码并将其用作学习算法的训练数据时,与使用原始矩阵本身作为训练数据相比,它在预测准确性方面提供了明显更好的结果.这种性能提升如何发生?

machine-learning data-mining data-analysis scikit-learn

123
推荐指数
1
解决办法
4万
查看次数

什么是期望最大化技术的直观解释?

期望最大化如果采用一种概率方法对数据进行分类.如果我错了,请纠正我,如果它不是分类器.

这种EM技术的直观解释是什么?这里的期望是什么,最大化的是什么?

cluster-analysis machine-learning mathematical-optimization data-mining expectation-maximization

105
推荐指数
4
解决办法
4万
查看次数

为什么F-Measure是一个调和均值而不是精确和召回措施的算术平均值?

当我们计算考虑精度和召回的F-测量时,我们采用两个测量的调和平均值而不是简单的算术平均值.

采用调和均值而不是简单平均值的直观原因是什么?

classification machine-learning data-mining

64
推荐指数
5
解决办法
1万
查看次数

1D数字阵列聚类

可能重复:
最佳地聚类一维数据?

所以,假设我有一个这样的数组:

[1,1,2,3,10,11,13,67,71]
Run Code Online (Sandbox Code Playgroud)

有没有一种方便的方法将数组分区为这样的东西?

[[1,1,2,3],[10,11,13],[67,71]]
Run Code Online (Sandbox Code Playgroud)

我查看了类似的问题,但是大多数人建议使用k-means来聚集点,比如scipy,这对像我这样的初学者来说非常混乱.另外我认为k-means更适合两维或更多维聚类吧?有没有办法根据数字将N个数组分组到多个分区/聚类?

有些人还提出了严格的范围分区,但并不总是按预期呈现结果

arrays cluster-analysis data-mining dimension partition-problem

61
推荐指数
2
解决办法
4万
查看次数

Gradient Descent和Newton's Gradient Descent有什么区别?

我理解Gradient Descent的作用.基本上它试图通过缓慢向下移动曲线来向局部最优解.我想了解计划梯度下降和牛顿方法之间的实际差异是什么?

从维基百科,我读了这条短线"牛顿的方法使用曲率信息来采取更直接的路线." 这直觉意味着什么?

machine-learning mathematical-optimization data-mining newtons-method gradient-descent

55
推荐指数
2
解决办法
3万
查看次数