我有一个 PDF 文档,想提取其中的所有文本。我尝试了以下方法:
import Quartz
let url = NSBundle.mainBundle().URLForResource("test", withExtension: "pdf")
let pdf = PDFDocument(URL: url)
print(pdf.string())
Run Code Online (Sandbox Code Playgroud)
它确实获得了文本,但是与在 Adobe 中打开 PDF、编辑全选、复制、粘贴相比,提取的行的顺序完全混淆了!
如何在 Swift 中获得与打开 PDF、全选、复制/粘贴相同的结果!?