Google文档PDF查看器如何工作?

Jee*_*raj 16 pdf google-docs

我很想知道Google Docs PDF查看器的工作原理吗?它不像scribd.com那样闪光; 它看起来像纯HTML.知道他们是怎么做到的吗?

用于查看PDF的示例链接

Ben*_*ard 18

谷歌只是提供一个图像(右键单击 - >另存为),并使用叠加层突出显示文本.

你应该查看这个问题,其他人会详细介绍.

您还应该查看PDF链接的来源,看起来谷歌正在传递PDF链接以转换为图像.

例:

<script type="text/javascript"> 
        var gviewElement = document.getElementById('gview');
        var config = {

          'api': false,
          'chrome': true,
          'csi': true,
          'ddUrl': "http://www.idfcmf.com/downloads/monthly_fund/2009/IDFC-Premier-Equityfund-jan10.pdf",
          'element': gviewElement,
          'embedded': false,
          'initialQuery': "",
          'oivUrl': "http://docs.google.com/viewer?url\x3dhttp%3A%2F%2Fwww.idfcmf.com%2Fdownloads%2Fmonthly_fund%2F2009%2FIDFC-Premier-Equityfund-jan10.pdf",
          'sdm': 200,
          'userAuthenticated': true
        };

        var gviewApp = _createGView(config);
        gviewApp.setProgress(50);


          window.jstiming.load.name = 'view';

          window.jstiming.load.tick('_dt');

      </script> 
Run Code Online (Sandbox Code Playgroud)

编辑

此外,如果您使用Firebug在Firefox中查看PDF查看器,您会注意到当您"突出显示"文本时,它实际上只启用了大量div,我猜测Google会使用OCR扫描文档,检测文本的位置和提供一个坐标基于矩阵放置的坐标矩阵,当您单击并拖动它时,它会插入鼠标指针位置以确定要显示的div.

  • 就我而言,我已经尽可能地回答了你的问题而没有实际调用谷歌并直接获取信息.你能具体想知道你想知道什么吗?我已经告诉过你PDF本身是如何呈现为图像的,我已经告诉过你文本突出显示是如何工作的?我对你想要的东西感到困惑,我没有解释.除了文本坐标(我非常肯定),我没有猜到,使用萤火虫并亲眼看看. (15认同)