使用Node查找PDF页面计数(在Windows上)

Jus*_*tin 6 javascript pdf node.js phantomjs pdf.js

我做了很多研究(我猜不够?)并且我正在尝试使用Node.js找到一个易于使用的库来查找PDF的页数.该库需要在Windows操作系统上可用.

有谁知道如何最好地接近这个?在最糟糕的情况下,我正在考虑使用PhantomJS和PDF.js库.

谢谢你的帮助!!

And*_*ers 6

因为它建立在pdf.js,pdf2json上,它应该在windows中工作.

我设法找到了测试文档的页数,如下所示:

var PDFParser = require('pdf2json');
var pdfParser = new PDFParser();

pdfParser.on('pdfParser_dataReady', function(data) {
    var doc = data.PDFJS && data.PDFJS.pdfDocument && data.PDFJS.pdfDocument.numPages;
    console.log('Number of pages:', doc);
});
// pdfParser.on('pdfParser_dataError', _.bind(_onPFBinDataError, self));

pdfParser.loadPDF('test.pdf');
Run Code Online (Sandbox Code Playgroud)

  • 在我研究过的几个解决方案中,这是第一个对我有用的解决方案(在Mac上使用Node)。我确实必须使用`data.formImage.Pages.length`访问页数。不知道是否有更好的方法,但是给定的解决方案(`data.PDFJS &&…`)对我来说不是开箱即用的。无论哪种方式,+ 1!:) (2认同)