我试图从PHP中包含至少5个单词的文本中提取所有句子.假设句子以句号,问题或感叹号结束,我想出了这个:
/[\w]{5,*}[\.|\?|\!]/
Run Code Online (Sandbox Code Playgroud)
有什么想法,有什么不对?
此外,需要做什么才能使用UTF-8?
\w只匹配一个字符.一个字就是\w+.如果您需要至少5个单词,您可以执行以下操作:
/(\w+\s){4,}\w+[.?!]/
Run Code Online (Sandbox Code Playgroud)
即至少4个单词后跟空格,后跟另一个单词后跟句子分隔符.