从哪里开始:使用Python进行自然语言处理和AI

Fey*_*n27 4 nlp artificial-intelligence deep-learning

我的目标是编写一个能够从人类语言查询中提取语气,个性和意图的程序(例如,我键入:您今天过得怎么样?而AI系统的响应则是:很好。您怎么样?)

我知道这是一个不平凡的问题,因此我应该开始熟悉哪些深度学习主题以及哪些Python模块最有用?我已经开始研究NLTK。谢谢。

alv*_*vas 6

规范的AI书将是Stuart Russell和Peter Norvig的Artifical Intelligence及其随附课程:https : //www.udacity.com/course/intro-to-artificial-intelligence--cs271

机器学习(ML)

吴安德(Andrew Ng)的机器学习课程是机器学习理论(ML)的一个很好的起点,它将对更流行的自然语言处理(NLP)任务有用。

华盛顿大学的 Emily Fox和Carlos Guestrin 的ML课程是机器学习和内部运作的一个很好的实际应用。

自然语言处理(NLP)

至于NLP,最受欢迎的入门书是Jurafsky和Martin的语音和语言处理

关于NLP的更多统计角度,Manning和Schutze的统计NLP书/课程

对于NLP的更实用方法,NLTK书是一个很好的起点:

为了对这些年来的NLP技术进行很好的概述,ACL选集保留了大多数已发表的NLP著名论文的档案。

另外一个很好的资源将是通过NLP / ML / AI的会议记录,Joel Tetreaul保留了有关会议及其提交日期的更新列表:http : //www.cs.rochester.edu/~tetreaul/conferences.html

其他资源

在线有大量AI,ML,NLP资源,最近还有神经网络。一个可以问任何问题的好论坛(不同于可能有限制的Stackoverflow)是https://www.reddit.com/r/MachineLearning/,也许更合适的stackexchange是datascience.stackexchange.com


很棒的清单

您可以通过awesome在github上搜索清单上的列表轻松地找到AI / ML / NLP的资源,例如:


Abt*_*Pst 5

@alvas的出色建议

对于深度学习,请看一下Google的Word2Vec算法。它特别适合于NLP问题。这是一个介绍用例

http://multithreaded.stitchfix.com/blog/2015/03/11/word-is-worth-a-thousand-vectors/

Google最近还发布了一个名为TensorflowMachine Learning 的python库,而Word2Vec也是其中的一部分

https://www.tensorflow.org/

最后,弄污双手的最佳地点是Kaggle比赛。尝试通读介绍性用例,以了解NLP和机器学习可以做什么

https://www.kaggle.com/competitions

大多数比赛看似颇具挑战性,但Kaggle拥有一系列非常不错的教程/入门比赛,可以帮助您入门。一旦知道了如何为基本的NLP / ML任务进行设置,就可以按自己的喜好使用。

快乐学习:)快乐学习