我有几个 Word 文档,其中添加换行符(段落分隔符)纯粹是出于美观的原因(可能是人类,但也可能是 OCR 系统或类似的东西)。我想从文档中删除这些额外的换行符。基本上,“额外”换行符是两边都被小写字母包围的换行符(带有可选的空格)。不幸的是,如果我想在 Word (^p) 中找到分段符,我不能使用字符类来只找到小写字母 ([az]),反之亦然。
基本上我想在文档上使用多行正则表达式,这样我就可以找到如下内容:
/[a-z]\s*\n\s*[a-z]/
Run Code Online (Sandbox Code Playgroud)
并用空格替换换行符。有什么办法可以同时搜索段落标记(Word 中的 ^p)和字符类(或者一般来说只是小写字母)?
例子:
标题¶
这是一些文字。
不会匹配,但是
这段文字在一行上,¶
继续到下一行。
将匹配并且“¶”将被替换为空格。