相关疑难解决方法(0)

从文本文件中删除unicode字符 - sed,其他bash/shell方法

如何从终端上的一堆文本文件中删除unicode字符?我试过这个,但它不起作用:

sed 'g/\u'U+200E'//' -i *.txt
Run Code Online (Sandbox Code Playgroud)

我需要从文本文件中删除这些unicodes

U+0091 - sort of weird "control" space
U+0092 - same sort of weird "control" space
A0 - non-space break
U+200E - left to right mark
Run Code Online (Sandbox Code Playgroud)

unicode bash spaces sed text-files

42
推荐指数
4
解决办法
8万
查看次数

用sed跳过/删除非ascii字符

Chip,Dirkland,DrobæSphereInc,cdirkland @ hotmail.com,usa

我一直在尝试使用sed来修改.csv中的电子邮件地址,但上面的一行仍然让我沮丧,使用如下命令:

sed -i 's/[\d128-\d255]//' FILENAME
Run Code Online (Sandbox Code Playgroud)

从这个stackoverflow问题

似乎没有工作,因为我得到'无效的校对字符'错误.

理想情况下,我根本不想改变组合的AE角色,我宁愿只是跳过它,因为我不是试图操纵该文本而是操纵电子邮件地址.只要那个AE在那里虽然它导致我的sed替换在一行之后失败,但是删除该字符并且它处理整个文件.

有任何想法吗?

sed

11
推荐指数
2
解决办法
1万
查看次数

标签 统计

sed ×2

bash ×1

spaces ×1

text-files ×1

unicode ×1