Używam następujący kod do odczytania zawartości pliku PDF:C++ Odczyt pliku PDF
string document;
FILE * f;
f = fopen (path , "rb");
unsigned char buffer[1024];
while(!feof(f)){
int bytes = fread(buffer,1,1024,f);
for(int i = 0; i < bytes; i++){
document += buffer[i];
cout << buffer[i];
}
}
fclose (f);
Problem polega na tym, że znaki nie są takie same jak podczas otwierania pliku w Edytor tekstu. Na przykład ten plik files.flashfan.ch/file.png
skutkuje tym wyjściu: files.flashfan.ch/output.png
Jak można odczytać pliku, tak, że znaki są dokładnie tak samo jak w edytorze? Chcę parsować pliki PDF, ale bez oryginalnych znaków nie mogę tego zrobić. mam testet kod z tego pliku (nie jest to plik PDF, po prostu częścią jednego, więc nie można go wyświetlić):
dzięki za pomoc!
@ user461872: parsowanie PDF to jedno, a czytanie PDF to kolejna. Ta ostatnia jest, moim zdaniem, bezużyteczna. Powiedz mi, co chcesz robić, czytając? – Nawaz
Chcę uzyskać listę obiektów PDF w dokumencie. Następnie przeczytaj niektóre obiekty, które pasują do mojej specyfikacji. Ale wiem, jak to zrobić, po prostu myślałem, że program odczytuje błędne znaki z pliku. Nie można przetworzyć pliku. –