我有一个带有水印的pdf背景.当开始扫描突出显示在背景上带有水印或注释的任何单词时,将首先在触摸区域中找到该单词.
我正在使用CGPDFScanner来扫描文本.
我的问题是如何检测扫描的文本是背景文本还是PDF格式的真实文本?如何区分标准文本和注释文本?
谢谢.
Type1字体/Differences编码在值的映射中使用字符串,例如1个字符被编码为'one'。它仅用于数字和特殊字符。
使用这些编码的标准方法是什么?
我应该如何从使用这种编码的PDF解码字符串?
文件链接:http : //www.filedropper.com/open
我目前正在使用 PDFKitten 进行 iOS PDF 扫描。我正在尝试提取文本以在具有 Type0 字体的 PDF 中进行搜索。我无法从 PDF 中提取文本。ToUnicode中的某些条目丢失,有些条目被误解。CMap 的解析可能有问题吗?如果我没有完整的CMap,我应该如何导出它?我可以为这些缺失的ToUnicode条目获取外部条目吗?
谢谢