我有一个使用OCR软件创建的文本文件 - 大小约为1兆字节.一些不常见的字符出现在整个文档中,其中大多数是OCR错误.
我想找到文档中使用的所有字符,以便轻松发现错误(如UNIQ命令,但对于字符,而不是行).
UNIQ
我在Ubuntu上.我应该使用什么Unix命令来显示文本文件中使用的所有字符?
unix ocr statistics command-line text
command-line ×1
ocr ×1
statistics ×1
text ×1
unix ×1