从邀请文本中检测时间、日期和地点的算法

Dar*_*der 4 api algorithm nlp artificial-intelligence machine-learning

我正在研究一些自然语言处理算法来阅读一段文本,如果文本似乎试图提出会议请求,它会自动为您设置该会议。

例如,如果电子邮件文本为:

让我们明天晚上 7 点市中心的某个地方见面”。

该算法应该能够检测事件的时间、日期和地点。

有人知道我可以用于此目的的一些现有 NLP 算法吗?我一直在研究一些 NLP 资源(如NLTKR 中的一些工具),但没有取得太大的成功。

谢谢

bur*_*urr 5

这是一种信息提取的应用,可以通过序列分割算法更具体地解决,例如隐马尔可夫模型 (HMM) 或条件随机场 (CRF)。

对于软件实现,您可能希望从 UMass-Amherst的MALLET 工具包开始,它是一个流行的库,用于实现用于信息提取的 CRF。

您可以将句子中的每个标记视为标记有您感兴趣的字段(或“x”表示上述任何一项),作为单词特征的函数(如词性、大写、字典成员资格等) .)...类似这样:

token       label       features
-----------------------------------
Let         x           POS=NNP, capitalized
's          x           POS=POS
meet        x           POS=VBP
tomorrow    DATE        POS=NN, inDateDictionary
someplace   x           POS=NN
in          x           POS=IN
Downtown    LOCATION    POS=NN, capitalized
at          x           POS=IN
7pm         TIME        POS=CD, matchesTimeRegex
.           x           POS=.
Run Code Online (Sandbox Code Playgroud)

不过,您首先需要提供一些手工标记的训练数据。