Czy to nawet możliwe!?!Czytanie danych z plików PDF na R
Mam kilka starszych raportów, które muszę zaimportować do bazy danych. Jednak wszystkie są w formacie pdf. Czy są jakieś pakiety R
, które mogą odczytać pdf? Czy powinienem zostawić to narzędzie wiersza poleceń?
Raporty zostały wykonane w programie Excel, a następnie w formacie PDF, więc mają regularną strukturę, ale wiele pustych "komórek".
Biorąc okiem na CRAN, tam nie wygląda na bibliotekę, która to robi. Lepiej możesz użyć innego języka, który ma takie biblioteki (Perl i Python, na przykład oba je mają), chwytając potrzebne dane, a następnie zapisując je do pliku, który może być odczytany przez R. –
@JackManey Dzięki , tak myślałem. W pakiecie 'tm' znajduje się' readPDF' (eksploracja tekstów), ale nie jest to dokładnie przyjazne dla użytkownika i myślę, że i tak używa on narzędzia komend 'pdftotext' pod maską. – Justin
Masz moje sympatie. Może pewnego dnia będziemy żyć w świecie, w którym wszystkie dane są dostępne jako dane! –