如何从终端上的一堆文本文件中删除unicode字符?我试过这个,但它不起作用:
sed 'g/\u'U+200E'//' -i *.txt
Run Code Online (Sandbox Code Playgroud)
我需要从文本文件中删除这些unicodes
U+0091 - sort of weird "control" space
U+0092 - same sort of weird "control" space
A0 - non-space break
U+200E - left to right mark
Run Code Online (Sandbox Code Playgroud) Chip,Dirkland,DrobæSphereInc,cdirkland @ hotmail.com,usa
我一直在尝试使用sed来修改.csv中的电子邮件地址,但上面的一行仍然让我沮丧,使用如下命令:
sed -i 's/[\d128-\d255]//' FILENAME
Run Code Online (Sandbox Code Playgroud)
似乎没有工作,因为我得到'无效的校对字符'错误.
理想情况下,我根本不想改变组合的AE角色,我宁愿只是跳过它,因为我不是试图操纵该文本而是操纵电子邮件地址.只要那个AE在那里虽然它导致我的sed替换在一行之后失败,但是删除该字符并且它处理整个文件.
有任何想法吗?