小编Luk*_*len的帖子

如何仅从文本块的某些部分删除换行符(或回车符)?

每当我从格式化为具有换行符(或回车符)的 PDF 文件中复制格式化文本时,我需要找到一种方法来删除这些换行符而不删除段落格式。

为此,我需要使用 RegEx(正则表达式)来仅删除前面没有句点的换行符。

因此,例如,如果一串文本在句点后立即有一个换行符,这显然几乎总是一个合法的换行符,它将开始一个新的段落。如果一串文本在单词中间或一个没有句点的单词之后有一个换行符,这只是我需要摆脱的错误格式的一部分。

我的问题是,我不知道如何使用 RegEx 使其仅删除 word 或 CRLF 中的 ^p 标签或任何格式的换行符,前提是它在句点后省略了一个。

carriage-return linebreaks

6
推荐指数
1
解决办法
2万
查看次数

标签 统计

carriage-return ×1

linebreaks ×1