Jan*_*bal 11
不仅"f"会丢失,"fl"也会丢失.
其原因是所谓的" 连字 ".为了看起来不错,一些字母组合,特别是fi,组合成一个字符.复制粘贴时很少能正确处理特殊字符.你可以在下面看到这个.如果您尝试选择连字,您会发现它只是一个"字母".请注意,您的计算机可以使用结扎线渲染两个单独的字母.
以下是"fi"连字:fi
以下是两个字母:fi
特别是在固定宽度字体中可见:
The following is a "fi" ligature: ?
The following is two letters: f?i
Run Code Online (Sandbox Code Playgroud)
我认为@warriormole无法复制的原因fl不是使用连字本身,而是忽视或忽略PDF文件创建者.10-15年前还没关系,每个人都很开心只是因为PDF中存在一些"图片"而没有人考虑过内容提取和逻辑文本而不是长期的视觉图片保存,而是现在(2010年创建的文件) ) 这是一个耻辱.
PDF提供了存储所使用的任何字形的Unicode表示的方法,并且相关文件可以相对容易地修复.