Dud*_*ude 24 algorithm nlp artificial-intelligence machine-learning
我最近参加了一个类coursera关于"自然语言处理",我学到了很多分析,IR和其他有趣的方面,例如Q&A等,虽然我掌握的概念很好,但我实际上并没有得到任何实用知识.任何人都可以建议我为自然语言处理提供良好的在线教程或书籍吗?
谢谢
dhg*_*dhg 34
您可以阅读Jurafsky和Martin的语音和语言处理(2008年版),这是该领域的标准教科书.它很长,并且有各种主题,所以我建议只阅读真正适合您兴趣的章节.
此外,最好的学习方法几乎肯定是从头开始实际实现NLP算法.您可以选择一些标准任务(语言建模,文本分类,POS标记,NER,解析)并从头开始实现各种算法(ngram模型,HMM,朴素贝叶斯,MaxEnt,CKY),以真正理解它们的工作原理.找到一些免费的数据集来测试你的实现也不是太难.
最后,有很多关于特定NLP算法的教程非常出色.例如,如果你想建立一个HMM,我建议Jason Eisner的教程也包括EM的平滑和无监督训练.如果你想为无人监督的朴素贝叶斯训练实施吉布斯采样,我建议菲利普雷斯尼克的教程.
除了Jurafsky和Martin的书之外,Christopher D. Manning和HinrichSchütze的统计自然语言处理基础也被广泛使用.对于IR,Manning等人.还写了信息检索简介,可以在他们的网站上在线阅读或下载.
如果您想了解如何使用自然语言的实用知识,您应该开始实施它.我建议在Python中使用NLTK(Natural Language Proecessing Toolkit).它很容易在python中实现NLP.
你可以参考这个链接 http://nltk.org/
或者您可以在http://cst.dk/online/pos_tagger/uk/上在线试用