小编Eri*_*son的帖子

如何计算包含Control和Unicode的文件中的所有字符?

首先,我为一个长期问题道歉.我正在寻找一个脚本,可以逐字逐句列出文件中的所有内容.我遇到了一个脚本并决定扩展它以显示控制字符和unicode.以下是我对此的尝试,但这并不完全正确.所以我要求一些帮助.我一直在研究如何正确读取UTF-8中的文件,如何不对它进行大量评论,但很少有关于适用于我的方法.

使用我的mac中的.DS_Store文件,我得到以下输出.我想了解如何解决警告(即不仅忽略它们,而是正确处理它们).我也在寻找一种方法来验证我做得对.例如od -c .DS_Store,一种方法,但我没有看到我的输出一对一匹配.

>charlist_v4 .DS_Store
utf8 "\x80" does not map to Unicode at /Users/ericdp/bin/charlist_v4 line 210.
utf8 "\x80" does not map to Unicode at /Users/ericdp/bin/charlist_v4 line 210.
utf8 "\x80" does not map to Unicode at /Users/ericdp/bin/charlist_v4 line 210.
utf8 "\x80" does not map to Unicode at /Users/ericdp/bin/charlist_v4 line 210.
utf8 "\x80" does not map to Unicode at /Users/ericdp/bin/charlist_v4 line 210.
utf8 "\x80" does not map to Unicode at /Users/ericdp/bin/charlist_v4 line 210.
               Dec     Hex  Letter   Count  Desc

     1 …
Run Code Online (Sandbox Code Playgroud)

unicode perl utf-8

2
推荐指数
1
解决办法
1173
查看次数

标签 统计

perl ×1

unicode ×1

utf-8 ×1