标签: data-mining

线性回归和逻辑回归有什么区别？

当我们必须预测分类(或离散)结果的值时,我们使用逻辑回归.我相信我们使用线性回归来预测输入值给出的结果值.

那么,这两种方法有什么区别？

machine-learning data-mining linear-regression

Lon*_*guy

2018 02-26

211
推荐指数

7
解决办法

21万
查看次数

被机器学习淹没 - 有 ML101 的书吗？

似乎有很多与机器学习相关的子领域。是否有一本书或博客概述了这些不同的领域以及每个领域的工作，也许如何开始，以及需要哪些背景知识？

machine-learning data-mining

Sta*_*low

2021 03-23

207
推荐指数

8
解决办法

3万
查看次数

数据挖掘中的分类和聚类之间的区别？

有人能解释数据挖掘中分类和聚类之间的区别吗？

如果可以,请举两个例子来理解主要想法.

terminology classification cluster-analysis machine-learning data-mining

Kri*_*aps

2018 07-24

191
推荐指数

7
解决办法

22万
查看次数

有人可以用一种非常简单的图形方式给出余弦相似性的例子吗？

维基百科上的Cosine Similarity文章

你能在这里(列表或其他东西)显示向量然后进行数学运算,让我们看看它是如何工作的？

我是初学者.

text data-mining cosine-similarity

TIM*_*MEX

2015 10-06

190
推荐指数

7
解决办法

14万
查看次数

亚马逊推荐功能如何运作？

亚马逊推荐技术的屏幕背后有什么技术？我相信亚马逊推荐目前是市场上最好的,但他们如何为我们提供这样的相关建议？

最近,我们参与了类似的推荐项目,但肯定希望从技术角度了解亚马逊推荐技术的来龙去脉.

任何投入都将受到高度赞赏.

更新:

该专利解释了如何完成个性化建议,但它不是非常技术性的,因此如果可以提供一些见解,那将是非常好的.

根据Dave的评论,亲和力分析构成了此类推荐引擎的基础.这里还有一些关于主题的好读物

推荐阅读:

数据挖掘:概念与技术

language-agnostic algorithm data-mining

Rac*_*hel

2013 05-20

142
推荐指数

4
解决办法

9万
查看次数

为什么一个热门编码可以提高机器学习性能？

我注意到,当在特定数据集(矩阵)上使用One Hot编码并将其用作学习算法的训练数据时,与使用原始矩阵本身作为训练数据相比,它在预测准确性方面提供了明显更好的结果.这种性能提升如何发生？

machine-learning data-mining data-analysis scikit-learn

mah*_*kya

2017 10-20

123
推荐指数

1
解决办法

4万
查看次数

什么是期望最大化技术的直观解释？

期望最大化如果采用一种概率方法对数据进行分类.如果我错了,请纠正我,如果它不是分类器.

这种EM技术的直观解释是什么？这里的期望是什么,最大化的是什么？

cluster-analysis machine-learning mathematical-optimization data-mining expectation-maximization

Lon*_*guy

2019 04-29

105
推荐指数

4
解决办法

4万
查看次数

为什么F-Measure是一个调和均值而不是精确和召回措施的算术平均值？

当我们计算考虑精度和召回的F-测量时,我们采用两个测量的调和平均值而不是简单的算术平均值.

采用调和均值而不是简单平均值的直观原因是什么？

classification machine-learning data-mining

Lon*_*guy

lucky-day

64
推荐指数

5
解决办法

1万
查看次数

1D数字阵列聚类

可能重复:
最佳地聚类一维数据？

所以,假设我有一个这样的数组:

[1,1,2,3,10,11,13,67,71]

Run Code Online (Sandbox Code Playgroud)

有没有一种方便的方法将数组分区为这样的东西？

[[1,1,2,3],[10,11,13],[67,71]]

Run Code Online (Sandbox Code Playgroud)

我查看了类似的问题,但是大多数人建议使用k-means来聚集点,比如scipy,这对像我这样的初学者来说非常混乱.另外我认为k-means更适合两维或更多维聚类吧？有没有办法根据数字将N个数组分组到多个分区/聚类？

有些人还提出了严格的范围分区,但并不总是按预期呈现结果

arrays cluster-analysis data-mining dimension partition-problem

E.H*_*.H.

2017 05-23

61
推荐指数

2
解决办法

4万
查看次数

Gradient Descent和Newton's Gradient Descent有什么区别？

我理解Gradient Descent的作用.基本上它试图通过缓慢向下移动曲线来向局部最优解.我想了解计划梯度下降和牛顿方法之间的实际差异是什么？

从维基百科,我读了这条短线"牛顿的方法使用曲率信息来采取更直接的路线." 这直觉意味着什么？

machine-learning mathematical-optimization data-mining newtons-method gradient-descent

Lon*_*guy

2018 12-20

55
推荐指数

2
解决办法

3万
查看次数

标签统计

data-mining ×10

machine-learning ×7

cluster-analysis ×3

classification ×2

mathematical-optimization ×2

algorithm ×1

arrays ×1

cosine-similarity ×1

data-analysis ×1

dimension ×1

expectation-maximization ×1

newtons-method ×1

scikit-learn ×1

terminology ×1

text ×1

标签 统计

标签统计