疾病命名实体识别

ale*_*lex 7 nlp machine-learning medical named-entity-recognition

我有一堆描述疾病的文本文件.这些文件在大多数情况下都很短,通常只包含一个句子.这里给出一个例子:

原发性肺动脉高压是一种进行性疾病,其中最小的肺动脉广泛闭塞导致肺血管阻力增加,随后导致右心室衰竭.

我需要的是一个工具,可以在句子中查找所有疾病术语(例如本例中的"肺动脉高压"),并将它们映射到像MeSH这样的受控词汇表.

提前感谢您的回答!

Pas*_*cal 6

以下是两个专门为医疗文档解析设计的管道:

两者都使用统一的医学语言系统UMLS,因此要求您拥有(免费)许可证.两者都是Java,或多或少易于设置.

  • 我不确定我会将它们归类为"易于设置",但它们确实工作得很好.去年年底也发布了新版MetaMap. (3认同)

Pie*_*rre 2

请参阅http://www.ebi.ac.uk/webservices/whatizit/info.jsf

Whatizit 是一个文本处理系统,允许您对文本执行文本挖掘任务。任务由上述窗口的下拉列表中的管道定义,并且可以将文本粘贴到文本区域中。

您也可以询问biostars:http://www.biostars.org/show/questions/