Sta*_*low 207 machine-learning data-mining
似乎有很多与机器学习相关的子领域。是否有一本书或博客概述了这些不同的领域以及每个领域的工作,也许如何开始,以及需要哪些背景知识?
Jef*_*ser 202
这是我听过的关于机器学习的最好描述:
机器学习实际上是一种软件方法。这是一种生成软件的方法。所以,它使用统计数据,但从根本上说……它几乎就像一个编译器。您使用数据来制作程序。-微软研究院杰出科学家 John Platt 在他 的 AI 未来系列演讲中 (2:17:53)
有些人甚至认为“ 15 年前算法对计算机科学来说是一切,而今天是机器学习。”
有关更多详细信息,我建议从有趣的介绍开始,例如 Peter Norvig 的Theorizing from Data talk、一瞥 DeepMind 正在做什么,或者最近的AI 系列演讲的未来(我从上面引用)。
接下来看看 Jeremy Howard 的“为数据科学运动做好准备”。这是实际处理数据的一个很好的实用概述。
一旦你玩了一会儿,看一下 Ben Hamner 的“机器学习小精灵”,以获得一个很好的务实免责声明,在进行机器学习时很容易出错。
在花了几个月的时间试图了解TrueSkill(在 Xbox Live 上进行匹配和排名的机器学习系统)后,我写了一篇博文“计算你的技能” 。这篇文章介绍了进一步研究机器学习所需的一些基础统计数据。
也许最好的学习方法就是尝试一下。一种方法是尝试一个听起来很有趣的Kaggle比赛。尽管我在那里的排行榜上表现不佳,但我总是在尝试比赛时学到东西。
完成上述操作后,我会推荐一些更正式的课程,例如 Andrew Ng 的在线课程。这是在大学水平,但平易近人。如果你已经完成了以上所有步骤,当你遇到一些更难的事情时,你会更有动力不放弃。
当你继续,你将了解的东西,如[R和其许多包,SciPy的,交叉验证,贝叶思,深 学习,和很多 更多。
免责声明:我在 Kaggle 工作,上面的几个链接提到了 Kaggle,但我相信它们是一个很好的起点。
Imr*_*ran 46
videolectures.net 有大量机器学习视频 。该网站上一个非常好的技术介绍性讲座是Sam Roweis 的Machine Learning, Probability and Graphical Models。
Tom Mitchell 的研讨会The Discipline and Future of Machine Learning对该领域进行了很好的概述。这是视频 [mov]的直接链接。和教学大纲页面有推荐教材的一个很好的列表: