如何将段落分成句子

Sco*_*ler 2 php regex split text-segmentation

我一直在尝试使用:

$string="The Dr. is here!!! I am glad I'm in the U.S.A. for the Dr. quality is great!!!!!!";
preg_match_all('~.*?[?.!]~s',$string,$sentences);
print_r($sentences);
Run Code Online (Sandbox Code Playgroud)

但它不适用于Dr.,USA等.

有没有人有更好的建议?

Mic*_*kan 12

对此没有任何简单的解决方案.你需要在你的应用程序中做一些自然语言处理(NLP)并识别每个句子.有一些东西叫OpenNLP,它是一个基于JAVA的NLP解析器工具.或Ruby中的Stanford NLP解析器.你可以找到类似PHP的东西.

在这里,我在PHP中找到了一组用于自然语言处理的类.