我有一个文本文档,其中包含大量文本,每个字母后都添加了一个额外的空格!
例子:
T h e b o o k a l s o h a s a n a n a l y t i c a l p u r p o s e w h i c h i s m o r e i m p o r t a n t…
Run Code Online (Sandbox Code Playgroud)
视觉上:
T␣h␣e␣␣b␣o␣o␣k␣␣a?l?s?o??h?a?s??a?n??a?n?a?l?y?t?i ?c?a?l??p?u?r?p?o?s?e??w?h?i?c?h??i?s??m?o?r?e??i? m?p?o?r?t?a?n?t…
请注意,每个字母后面都有一个额外的空格,因此连续单词之间有两个空格。
有没有办法获得awk或sed删除多余的空格?(不幸的是,这个文本文档很大,需要很长时间手动完成。)
我很欣赏这可能是一个更复杂的问题,只需一个简单的 bash 脚本即可解决,因为还需要某种文本识别。
我该如何解决这个问题?