小编hen*_*y74的帖子

你如何解析一段文字到句子?(在Ruby中)

你如何考虑段落或大量的文本并将其分解为句子(最好使用Ruby),同时考虑到Mr.和Dr.以及USA这样的案例?(假设你只是将句子放入一个数组数组中)

更新:我想到的一个可能的解决方案是使用词性标注器(POST)和分类器来确定句子的结尾:

从琼斯先生那里获取数据时,他走出意大利避暑别墅的阳台,感受到了温暖的阳光.他很高兴活着.

CLASSIFIER先生/ PERSON Jones/PERSON感觉/ O/O温暖/ O太阳/ O开/ O他/ O面/ O as/O他/ O步/ O出/ O到/ O/O阳台/ O/O他/ O夏天/ O家/ O in/O意大利/ LOCATION ./O他/ O是/ O快乐/ O到/ O是/ O活着/ O ./O

POST先生/ NNP Jones/NNP感觉/ VBD/DT温暖/ JJ太阳/ NN on/IN他/ PRP $ face/NN as/IN他/ PRP踩/ VBD输出/ RP上/ IN/DT阳台/ NN /他/ PRP $ summer/NN home/NN in/IN Italy./NNP He/PRP/VBD happy/JJ to/TO be/VB alive./IN

我们可以假设,由于意大利是一个地点,这段时间是句子的有效结束吗?自从"先生"结束 没有其他词性,我们可以假设这不是一个有效的句末期吗?这是我问题的最佳答案吗?

思考?

ruby parsing text split nlp

22
推荐指数
4
解决办法
2万
查看次数

时间提取(即从自由格式文本中提取日期/时间实体) - 如何?

有没有人找到一种简单但有效的方法从文本中提取日期引用?我已经做了大量的时间提取工具搜索,但是没有很多东西.有一些白皮书,但它似乎属于整个语义网的一个子集,但没有给予太多的关注.

我只是在找80%有效的东西.没有必要捕捉像"2009年1月之后的月份"之类的东西,但是基本的日期实体会很好.

我对所有建议持开放态度,甚至是花哨的正则表达式.

消防!

(谢谢 - 亨利)

date extraction temporal semantics

9
推荐指数
1
解决办法
1349
查看次数

标签 统计

date ×1

extraction ×1

nlp ×1

parsing ×1

ruby ×1

semantics ×1

split ×1

temporal ×1

text ×1