如何从 PDF 复制此报价?

Iai*_*der 5 pdf google-chrome copy-paste

可能重复:
复制粘贴时 PDF 出现乱码

我正在阅读Jerome H. Friedman 论文“数据挖掘和统计:有什么联系?”的PDF 副本。使用谷歌浏览器。

它包含一个有趣的引语,我想将其复制并粘贴到我的博客中。

我用鼠标选择引用的文本,然后按CTRL+C复制文本。该文件如下所示:

杰罗姆论文中的重点引述。

当我将文本粘贴到记事本、Stack Overflow 或其他任何地方时,该产品就像 Wingdings 一样乱码:

?????????????????????????????????????????? ?????????????????????????????????????????????????????? ???????????????????????? ????????????????P???? ?????????????????????P?????????????????????????????? ?????????????????????????????????????????? ????????????Þ??????????????????????????????????????? ?????????????????????????????????

文本应如下所示:

这个领域的统计学家和计算机科学家之间的区别似乎在于,当统计学家有一个想法时,他或她会写一篇论文;一位计算机科学家创办了一家公司。

我不得不手动输入该文本。这对于这么小的报价是可行的,但我如何实际复制我所看到的?

PDF、浏览器、插件或三者的某种组合有什么不寻常的地方吗?

Ank*_*kit 6

最可靠的方法是使用 OCR。

但是作为一个肮脏和快速的解决方案,您可以从链接的搜索结果中使用 Google Quick View,在 Quick view 中使用选项View > Plain HTML

它仍然包含一些乱码并且难以阅读,但大量文本是正确且可 复制的。搜索在这里工作,因此您可以使用它来定位目标文本并复制它,而不会出现任何乱码。


详细示例在这里:
URL 的 Google 搜索结果包括快速查看链接。
然后使用 View 选项Plain HTML
快速查看有一个选项可以将文档查看为 HTML。
在 Google 的HTML 版本上,您可以搜索并选择这样的等效文本:
搜索 HTML 版本以查找并选择相关报价。
粘贴到记事本中会产生以下输出:

该领域的统计学家和计算机科学家之间的区别似乎在于,当统计学家有一个想法时,他或她会写一篇论文;一位计算机科学家创办了一家公司。

与显示的不完全一样,但足够接近您可以使用它。

  • 我忘记了谷歌以这种方式缓存了 PDF!很有用。我编辑了您的答案以包含带图片的分步指南,以使此答案更普遍有用。 (2认同)