A.nnotate.com背后使用了什么技术?

thi*_*ter 4 pdf html5 annotations document-conversion scribd

我想知道A.nnotate.com,Scribd,Google Docs等服务如何将pdf,.doc或任何其他文档呈现为HTML以及注释系统如何工作?

小智 5

A.nnotate.com使用xpdf以给定的缩放级别将PDF页面的服务器端转换为PNG图像 - 这些是在浏览器中显示的内容.

文本高亮显示从PDF提取文本的位置,然后的话顶部的页面图像的顶部添加透明覆盖有绝对定位的HTML DIVS完成.然后,注释使用ajax gui将注释附加到突出显示的文本.

其他格式(MS Word,PPT等)首先使用openoffice转换为PDF,然后转换为PDF格式的图像和文本叠加.

我认为其他HTML文档网站的做法类似于将PDF呈现为HTML(即页面图像+文字叠加作为透明div) - 另一种技巧是将PDF嵌入字体转换为HTML5 CSS字体,并使用绝对定位的文本div(并提取和定位图像).