我是一个正则表达式的菜鸟,试图将段落分成句子.在我的语言中,我们在句子中间使用了相当多的缩写(例如:bl.a.),所以我得出结论,我需要做的是寻找标点,然后是单个标点符号空格,然后是一个以大写字母开头的单词,如:
[sentence1]...anymore. However...[sentence2]
Run Code Online (Sandbox Code Playgroud)
所以一段如下:
Der er en lang og bevæget forhistorie bag lov om varsling m.v. i forbindelse med afskedigelser af større omfang. Det er ikke en bureaukratisk lovtekst blandt så mange andre.
Run Code Online (Sandbox Code Playgroud)
应以此输出结束:
[0] => Der er en lang og bevæget forhistorie bag lov om varsling m.v. i forbindelse med afskedigelser af større omfang.
[1] => Det er ikke en bureaukratisk lovtekst blandt så mange andre.
Run Code Online (Sandbox Code Playgroud)
而不是这个:
[0] => Der er en lang og bevæget forhistorie bag lov om …Run Code Online (Sandbox Code Playgroud)