Dar*_*der 4 api algorithm nlp artificial-intelligence machine-learning
我正在研究一些自然语言处理算法来阅读一段文本,如果文本似乎试图提出会议请求,它会自动为您设置该会议。
例如,如果电子邮件文本为:
让我们明天晚上 7 点在市中心的某个地方见面”。
该算法应该能够检测事件的时间、日期和地点。
有人知道我可以用于此目的的一些现有 NLP 算法吗?我一直在研究一些 NLP 资源(如NLTK和R 中的一些工具),但没有取得太大的成功。
谢谢
这是一种信息提取的应用,可以通过序列分割算法更具体地解决,例如隐马尔可夫模型 (HMM) 或条件随机场 (CRF)。
对于软件实现,您可能希望从 UMass-Amherst的MALLET 工具包开始,它是一个流行的库,用于实现用于信息提取的 CRF。
您可以将句子中的每个标记视为标记有您感兴趣的字段(或“x”表示上述任何一项),作为单词特征的函数(如词性、大写、字典成员资格等) .)...类似这样:
token label features
-----------------------------------
Let x POS=NNP, capitalized
's x POS=POS
meet x POS=VBP
tomorrow DATE POS=NN, inDateDictionary
someplace x POS=NN
in x POS=IN
Downtown LOCATION POS=NN, capitalized
at x POS=IN
7pm TIME POS=CD, matchesTimeRegex
. x POS=.
Run Code Online (Sandbox Code Playgroud)
不过,您首先需要提供一些手工标记的训练数据。
归档时间: |
|
查看次数: |
2298 次 |
最近记录: |