将PDF页面解析为javascript图像

Sat*_*nix 13 javascript pdf bash image

根据标题,有什么办法可以将未受保护的PDF文件中的页面解析为javascript Image()对象?

在运行javascript之前将它们转换也可以,但我希望这可以自动完成,无需任何需要安装的库的帮助.

互联网上有人发布了这个Bash脚本.不幸的是,我不知道Bash,但运行它非常简单.

#!/bin/bash
PDF='doc.pdf'
NUMPAGES=`identify -format %n "$PDF"`

for (( IDX=0; IDX<$NUMPAGES; IDX++ ))
do
  PAGE=$(($IDX+1))
  convert -resize 1200x900 "$PDF[$IDX]" `echo "$PDF" | sed "s/\.pdf$/-page$PAGE.jpg/"`
done

echo "Done"
Run Code Online (Sandbox Code Playgroud)

但我得到了这些错误:

line 3: identify: command not found
line 5: ((: IDX<: syntax error: operand expected (error token is "<")
Run Code Online (Sandbox Code Playgroud)

使用Bash脚本预转换PDF将是一个很好的解决方案.有人可以修复上面的脚本或提供替代解决方案吗?

提前谢谢了!

Tre*_*xon 22

PDF.js将允许您将PDF渲染到画布.然后你可以这样做:

var img = new Image();
img.src = pdfCanvas.toDataURL();
Run Code Online (Sandbox Code Playgroud)

我对PDF.js印象非常深刻.我喜欢让客户的浏览器为我做尽可能多的工作.

在这里演示:http://jsbin.com/pdfjs-helloworld-v2/1/edit

  • @MPV 不再工作了。你还有另一个链接吗? (2认同)