thi*_*ter 4 pdf html5 annotations document-conversion scribd
我想知道A.nnotate.com,Scribd,Google Docs等服务如何将pdf,.doc或任何其他文档呈现为HTML以及注释系统如何工作?
小智 5
A.nnotate.com使用xpdf以给定的缩放级别将PDF页面的服务器端转换为PNG图像 - 这些是在浏览器中显示的内容.
文本高亮显示从PDF提取文本的位置,然后的话顶部的页面图像的顶部添加透明覆盖有绝对定位的HTML DIVS完成.然后,注释使用ajax gui将注释附加到突出显示的文本.
其他格式(MS Word,PPT等)首先使用openoffice转换为PDF,然后转换为PDF格式的图像和文本叠加.
我认为其他HTML文档网站的做法类似于将PDF呈现为HTML(即页面图像+文字叠加作为透明div) - 另一种技巧是将PDF嵌入字体转换为HTML5 CSS字体,并使用绝对定位的文本div(并提取和定位图像).
| 归档时间: |
|
| 查看次数: |
645 次 |
| 最近记录: |