用于从源文本文件中删除扩展 ASCII 字符的 OSX 命令行工具或简单应用程序是什么?

jpe*_*kin 0 ascii extended-ascii

我一直在将 Amazon Kindle 电子书中的一些代码片段剪切并粘贴到文本编辑器 (JetBrains PhpStorm) 中,显然每次它都带有一些扩展 (>127) ASCII 字符。

是否有简单的 cmd 行 sed/awk/tr 命令,或者一个简单的 OSX 应用程序可以将它们删除?

jpe*_*kin 5

感谢这篇博文,这是一个对我来说效果很好的解决方案:

tr -cd '\11\12\15\40-\176' < infile > outfile
Run Code Online (Sandbox Code Playgroud)

请注意,如果您收到此错误:tr: Illegal byteequence,可以通过以下方式设置 LANG=C 来解决:

export LANG=C
Run Code Online (Sandbox Code Playgroud)

(不知道为什么设置 LANG=C 有帮助,但这就是其他有同样问题的人正在做的事情)