2015-05-08 13 views
5

Zrobiłem wiele badań (chyba nie wystarczy?) I próbuję znaleźć łatwą w użyciu bibliotekę, aby znaleźć liczbę stron w pliku PDF przy użyciu pliku Node.js. Biblioteka musiałaby być użyteczna w systemie operacyjnym Windows.Znajdź liczbę stron PDF z węzłem (w systemie Windows)

Ktoś wie, jak najlepiej się do tego podejść? W najgorszej sytuacji myślałem o zrobieniu czegoś z PhantomJS i biblioteką PDF.js.

Dzięki za pomoc !!

+0

https://github.com/mozilla/pdf.js/blob/master/examples/node/getinfo.js? – async5

Odpowiedz

5

Ponieważ jest zbudowany na pdf.js, pdf2json powinien działać w systemie Windows.

udało mi się znaleźć liczbę stron dokumentu testowego tak:

var PDFParser = require('pdf2json'); 
var pdfParser = new PDFParser(); 

pdfParser.on('pdfParser_dataReady', function(data) { 
    var doc = data.PDFJS && data.PDFJS.pdfDocument && data.PDFJS.pdfDocument.numPages; 
    console.log('Number of pages:', doc); 
}); 
// pdfParser.on('pdfParser_dataError', _.bind(_onPFBinDataError, self)); 

pdfParser.loadPDF('test.pdf'); 
+1

Spośród kilku rozwiązań, na które patrzyłem, ten był pierwszym rozwiązaniem, które zadziałało (używając Node na Macu). Musiałem uzyskać dostęp do liczby stron za pomocą: 'data.formImage.Pages.length'. Nie jestem pewien, czy istnieje lepszy sposób, ale podane rozwiązanie ('data.PDFJS && ...') nie działa dla mnie po wyjęciu z pudełka. Tak czy siak, +1! :) – mhulse

+0

Ah, to również zadziałało: 'console.log (parser.PDFJS && parser.PDFJS.pdfDocument && parser.PDFJS.pdfDocument.numPages);'. Tak więc obiekt 'parser' zawiera' numPages'. Ciekawy! – mhulse

Powiązane problemy