被机器学习淹没 - 有 ML101 的书吗?

Sta*_*low 207 machine-learning data-mining

似乎有很多与机器学习相关的子领域。是否有一本书或博客概述了这些不同的领域以及每个领域的工作,也许如何开始,以及需要哪些背景知识?

Jef*_*ser 202

这是我听过的关于机器学习的最好描述:

机器学习实际上是一种软件方法。这是一种生成软件的方法。所以,它使用统计数据,但从根本上说……它几乎就像一个编译器。您使用数据来制作程序。-微软研究院杰出科学家 John Platt 在他 的 AI 未来系列演讲中 (2:17:53)

有些人甚至认为“ 15 年前算法对计算机科学来说是一切,而今天是机器学习。”

有关更多详细信息,我建议从有趣的介绍开始,例如 Peter Norvig 的Theorizing from Data talk、一瞥 DeepMind 正在做什么,或者最近的AI 系列演讲未来(我从上面引用)。

接下来看看 Jeremy Howard 的“为数据科学运动做好准备”。这是实际处理数据的一个很好的实用概述。

一旦你玩了一会儿,看一下 Ben Hamner 的“机器学习小精灵”,以获得一个很好的务实免责声明,在进行机器学习时很容易出错。

在花了几个月的时间试图了解TrueSkill(在 Xbox Live 上进行匹配和排名的机器学习系统)后,我写了一篇博文“计算你的技能” 。这篇文章介绍了进一步研究机器学习所需的一些基础统计数据。

也许最好的学习方法就是尝试一下。一种方法是尝试一个听起来很有趣的Kaggle比赛。尽管我在那里的排行榜上表现不佳,但我总是在尝试比赛时学到东西。

完成上述操作后,我会推荐一些更正式的课程,例如 Andrew Ng 的在线课程。这是在大学水平,但平易近人。如果你已经完成了以上所有步骤,当你遇到一些更难的事情时,你会更有动力不放弃。

当你继续,你将了解的东西,如[R和其许多包SciPy的交叉验证贝叶思 学习,和很多 更多

免责声明:我在 Kaggle 工作,上面的几个链接提到了 Kaggle,但我相信它们是一个很好的起点。


Imr*_*ran 46

videolectures.net 有大量机器学习视频 。该网站上一个非常好的技术介绍性讲座是Sam Roweis 的Machine Learning, Probability and Graphical Models

Tom Mitchell 的研讨会The Discipline and Future of Machine Learning对该领域进行了很好的概述。这是视频 [mov]的直接链接。和教学大纲页面有推荐教材的一个很好的列表:


dmc*_*cer 15

Ethem Alpaydin 的机器学习简介是该领域的一个非常易于理解的概述。

如果您对其他选项感到不知所措,您可能想先从它开始。


Mr *_*ooz 12

最好的两本教科书是:

另一个很好的资源是 MIT 的机器学习课程的 Open CourseWare 站点。


Mat*_*sen 8

我真的很喜欢Coursera上的机器学习课程。我发现简短的讲座很容易消化。


Tir*_*ton 7

我发现“ Programming Collective Intelligence ”是真正对我有帮助的书(带有实际示例),最后是“Algorithm Beastiary”。


Vol*_*il3 7

Yaser Abu Mustafa 博士的介绍课程也很详细,他解释得很好

http://work.caltech.edu/telecourse.html


the*_*rty 6

人工智能:现代方法是人工智能入门课程最常见的教科书。

如果 Witten 和 Frank 的关于数据挖掘的书对您有吸引力,那么它会更容易理解。