Python阿拉伯语NLP

Bas*_*sem 19 python nlp arabic

我正在评估NLTK处理阿拉伯文本在分析和提取情绪方面的能力.

问题如下:

  1. NTLK是否能够处理并允许分析阿拉伯语文本?
  2. python是否能够操纵\标记化阿拉伯语文本?
  3. 我能用Python解析和存储阿拉伯语文本吗?

如果python和NTLK不是这项工作的工具,你会推荐哪些工具(如果存在)?

谢谢.


编辑

基于研究:

  1. NTLK只能阻止阿拉伯语文本:链接
  2. Python能够处理阿拉伯语文本,因为它支持UTF-8 unicode:Link
  3. 阿拉伯语文本的解析和词形还原可以使用:SNLPG(斯坦福自然语言处理组)统计分析器:链接

Bor*_*lik 6

一个简单的谷歌搜索导致这些链接:

阿拉伯语自然语言处理

使用Python与古兰经阿拉伯语语料库

HOWTO:使用Python,Unicode和阿拉伯语

这些都有用吗?

  • 感谢您的贡献。但是,我的问题需要根据上述主题的经验来回答。我搜索了很多,发现许多词法解析器能够解析基于 Penn Arab Treebank 的阿拉伯语句子,但没有关于文本分析和情感提取的内容。我会暂时不回答这个问题,也许其他人可以贡献他的一些知识。如果不是,我会将您的答案视为正确答案。 (3认同)
  • @Frumples我还没有找到现成的引擎,我们最终建立了一个从未发布的专有解决方案. (3认同)