我在记事本++中有一些我以前从未见过的条目。我在许多行上突出显示了带有 和 的方块SGCI SSA PU1 PU2 MW,SPA如果在这里复制/粘贴,所有方块都会翻译成/成为``
我正在寻找一种方法来从条目中删除这些内容。谷歌表示它们是“控制字符”,但对于我来说,它们太多了,无法尝试手动删除。
尝试过[\x00-\x09\x0B-\x0C\x0E-\x1F],但显然它没有/没有涵盖有问题的角色。
这是一些行的示例,以防我原来的帖子不够清楚。
这是文件本身。
所有这些字符都是UTF8
[\x{0080}-\x{0099}]或[\x00-\x09\x0B-\x0C\x0E-\x1F]LEAVE EMPTY或任何你想要的解释:
[ # character class
\x{0080} # from character http://www.fileformat.info/info/unicode/char/0080/index.htm
- # upto
\x{0099} # character http://www.fileformat.info/info/unicode/char/0099/index.htm
] # end character class
Run Code Online (Sandbox Code Playgroud)
[ # character class
\x00-\x09 # hex 00 to 09
\x0B-\x0C # hex 0B to 0C
\x0E-\x1F # hex 0E to 1F
] # end character class
Run Code Online (Sandbox Code Playgroud)
您可以调整该范围以满足您的需求。
截图(之前):
我从你的示例文件中取出了一些行。
截图(之后):
这里我用了XXXas replacement 来看看替换完成的地方。
| 归档时间: |
|
| 查看次数: |
18250 次 |
| 最近记录: |