如何识别给定文本中的想法和概念

Nic*_*ick 9 nlp artificial-intelligence text-mining nltk

我正在开展一个项目,目前能够检测文本正文中何时提到某个主题/想法非常有用.例如,如果文本包含:

也许如果你告诉我一些关于琼斯先生的事情,那会有所帮助.如果我可以描述他的外表,甚至更好的照片,这也会很有用吗?

能够发现这个人要求拍摄琼斯先生的照片真是太棒了.我可以采取一种非常天真的方法,只是寻找"照片"或"照片"这个词,但如果他们写下这样的话,这显然是不好的:

请永远不要给我发一张琼斯先生的照片.

有谁知道从哪里开始这个?它甚至可能吗?

我已经研究了像nltk这样的东西,但我还没有找到一个人做类似事情的例子,我仍然不完全确定这种分析是什么.任何可以让我离开的帮助都会很棒.

谢谢!

Jak*_*mpl 1

NLTK 对于解析自然语言来说是一个不错的框架,但要注意这不是一件简单的事情。做这样的事情确实是研究级别的编程。

使它变得更容易的一件好事是,如果您的领域非常有限 - 假设您的应用程序专注于有关著名作家的信息,那么您可以避免自然语言的一些复杂性,例如某些类型的歧义。

从哪儿开始?好问题。我不知道有关于这个主题的任何教程(我猜你尝试过 Google 选项),但我想 iTunes U 会有关于这个主题的课程。如果没有,我可以发布一个我完成的课程的链接,该课程提到了该主题并且并不完全可怕:http://www.inf.ed.ac.uk/teaching/courses/inf2a/lecturematerials/index.html #讲座01