2012-01-20 7 views
19

Chcę opracować aplikację do czytania książek elektronicznych. Jakie są dobre biblioteki do analizy formatów takich jak .azw, .mobi, .pdf itd.?eBook parser (.azw, .mobi, epub)?

+0

kilka pytań, które mogą być pomocne dla Ciebie. [This] (http://stackoverflow.com/questions/4665957/pdf-parsing-library-for-android) i [this] (http://stackoverflow.com/questions/4773576/are-there-any-free -pdf-parsing-library-that-work-in-android). –

+0

No tak, ale to tylko dla plików pdf. epub jest po prostu spakowanym plikiem html, więc można go rozwiązać, ale inne? – Richard

+0

Podczas gdy znalezienie biblioteki może być najłatwiejszym rozwiązaniem (bez oceny, też bym ją szukał!), Jeśli nie możesz jej znaleźć, sprawdź, jakie pliki faktycznie są. W pewnym momencie są to tekst lub obrazy. Dowiedz się, co odróżnia jeden format od drugiego. Na przykład Richard mówi, że epuby są spakowane w html. Rozpakuj go i przeanalizuj kod HTML w swojej aplikacji. Na pewno możesz znaleźć bibliotekę parsowania html. Wygląda na to, że będzie to więcej pracy, niż ci się spodziewali, ale byłoby to dobre ćwiczenie. I hej, jeśli dobrze to zakodujesz, możesz stworzyć bibliotekę ebooków, której inni będą używać :) –

Odpowiedz

9

Jak powiedział Ranhiru, here i here można zobaczyć, jak analizowane są pliki PDF. Dla .mobi nie ma jednak biblioteki, więc sam musisz przeanalizować format. Pełna specyfikacja formatu można przeczytać on the mobileread wiki.

W przypadku plików .azw jest inaczej: jeśli ebook Kindle jest wolny od DRM, jego format jest zgodny z numerem .mobi, tzn. Są one całkowicie zamienne. W przeciwnym razie jest to bardzo trudne, ponieważ będziesz musiał wygenerować Kindle PID i wykonać de-DRM-owanie pliku .azw. Jest tam przewodnik, jak to zrobić na pulpicie here. Jest to jednak niezalecane, ponieważ jest to niezasadne, ponieważ łamie cały punkt DRM i jest nielegalne praktycznie wszędzie.