小编jas*_*nes的帖子

从文本文件中删除未知的 unicode 字符 - sed、其他 bash/shell 方法

我需要在某些具有相同名称的文件中搜索并替换所有出现的未知字符。

使用 vi 打开此类文件,我读取了该字符的 <91> 代码。用nano打开它们,我读到一个菱形(黑色隆隆声)上的“问号”。

我想用引号 (') 替换这种未知字符。我尝试了很多方法但没有运气。

我试过:

find ./ -name filename.txt -exec perl -i~ -pe "s/\x91/'/" {} \;



find ./ -name filename.txt -exec sed -i "s/\x91/'/g" {} \;
Run Code Online (Sandbox Code Playgroud)

编辑 有关角色的更多信息:

Hexadecimal: 91 68 74 74
Decimal: 145 104 116 116
Octal: 221 150 164 164
Binary: 10010001 01101000 01110100 01110100

LC_ALL=C sed -n l < file

\221
Run Code Online (Sandbox Code Playgroud)

如果您需要更多,请询问!

sed perl wildcards replace file-search

9
推荐指数
1
解决办法
1万
查看次数

标签 统计

file-search ×1

perl ×1

replace ×1

sed ×1

wildcards ×1