相关疑难解决方法(0)

如何从终端上的一堆文本文件中删除unicode字符？我试过这个,但它不起作用:

sed 'g/\u'U+200E'//' -i *.txt

我需要从文本文件中删除这些unicodes

U+0091 - sort of weird "control" space
U+0092 - same sort of weird "control" space
A0 - non-space break
U+200E - left to right mark

42
推荐指数

4
解决办法

8万
查看次数

Chip,Dirkland,DrobæSphereInc,cdirkland @ hotmail.com,usa

我一直在尝试使用sed来修改.csv中的电子邮件地址,但上面的一行仍然让我沮丧,使用如下命令:

sed -i 's/[\d128-\d255]//' FILENAME

似乎没有工作,因为我得到'无效的校对字符'错误.

理想情况下,我根本不想改变组合的AE角色,我宁愿只是跳过它,因为我不是试图操纵该文本而是操纵电子邮件地址.只要那个AE在那里虽然它导致我的sed替换在一行之后失败,但是删除该字符并且它处理整个文件.

有任何想法吗？

11
推荐指数

2
解决办法

1万
查看次数

sed ×2