leo*_*now 8 text-processing unicode replace
我有很多大的 Unicode 文件。我想用新的 Unicode 字节对替换每个 Unicode 字节对。例如,原始文件包含“C3 B9 C3 AB C3 B8 C3 B0”,我想将其替换为“D7 A0 D7 A8 D7 9B D7 A9”。我需要在整个文件中用“D7 A0”替换每个“C3 B9”。将有大约 30 个不同的“C3 XX”值替换为“D7 YY”值。我需要一个表格来循环每次替换。
理想情况下,这将替换原始文件,但它也可以创建一个新的输出文件。
是否有在 Ubuntu 下运行的实用程序可以完成这项工作?
用 Perl 就可以做到这一点,
示例文件:
echo -e "\xe8\x90" > a
现在如果你这样做:
perl -pne 's/\xe8\x90/\x41\x42/g' < a > output
你得到0x41 0x42,即AB