我有一个从pdf文件转换的文本内容.文本中有一些不需要的字符,我想将它们转换为utf-8字符.
例如; "人工免疫系统"转换像"ARTI 音响官方免疫系统".fi像一个字符一样转换,我曾经gdex学过ascii字符的价值,但我不知道如何用所有内容中的实际值替换它.
gdex
ascii
python pdf character ligature
character ×1
ligature ×1
pdf ×1
python ×1