如何删除记事本++中明显的控制字符?

kle*_*906 0 notepad++ regex

我在记事本++中有一些我以前从未见过的条目。我在许多行上突出显示了带有 和 的方块SGCI SSA PU1 PU2 MWSPA如果在这里复制/粘贴,所有方块都会翻译成/成为``

我正在寻找一种方法来从条目中删除这些内容。谷歌表示它们是“控制字符”,但对于我来说,它们太多了,无法尝试手动删除。

尝试过[\x00-\x09\x0B-\x0C\x0E-\x1F],但显然它没有/没有涵盖有问题的角色。

在此输入图像描述

这是一些行的示例,以防我原来的帖子不够清楚。

在此输入图像描述

这是文件本身。

https://www.dropbox.com/s/lymgnxy9p0atp8x/TrophyID.txt?dl=0

Tot*_*oto 5

所有这些字符都是UTF8

  • Ctrl+H
  • 查找内容:[\x{0080}-\x{0099}][\x00-\x09\x0B-\x0C\x0E-\x1F]
  • 替换为:LEAVE EMPTY或任何你想要的
  • 检查 环绕
  • 检查 正则表达式
  • Replace all

解释:

[                 # character class
    \x{0080}        # from character http://www.fileformat.info/info/unicode/char/0080/index.htm
  -               # upto
    \x{0099}        # character http://www.fileformat.info/info/unicode/char/0099/index.htm
]                 # end character class
Run Code Online (Sandbox Code Playgroud)
[                 # character class
    \x00-\x09       # hex 00 to 09
    \x0B-\x0C       # hex 0B to 0C
    \x0E-\x1F       # hex 0E to 1F
]                 # end character class
Run Code Online (Sandbox Code Playgroud)

您可以调整该范围以满足您的需求。

截图(之前):

我从你的示例文件中取出了一些行。

在此输入图像描述

截图(之后):

这里我用了XXXas replacement 来看看替换完成的地方。

在此输入图像描述