Sco*_*ler 2 php regex split text-segmentation
我一直在尝试使用:
$string="The Dr. is here!!! I am glad I'm in the U.S.A. for the Dr. quality is great!!!!!!";
preg_match_all('~.*?[?.!]~s',$string,$sentences);
print_r($sentences);
Run Code Online (Sandbox Code Playgroud)
但它不适用于Dr.,USA等.
有没有人有更好的建议?
Mic*_*kan 12
对此没有任何简单的解决方案.你需要在你的应用程序中做一些自然语言处理(NLP)并识别每个句子.有一些东西叫OpenNLP,它是一个基于JAVA的NLP解析器工具.或Ruby中的Stanford NLP解析器.你可以找到类似PHP的东西.
在这里,我在PHP中找到了一组用于自然语言处理的类.
| 归档时间: |
|
| 查看次数: |
5276 次 |
| 最近记录: |