2012-08-28 18 views
8

Korzystam z apara google google do przechowywania i pobierania plików pdf. Chciałbym zapytać o te pliki za pomocą parametrów wyszukiwania.Google napędza limit indeksowania dużych plików?

Ale zanim zacznę to wdrażać. Chciałbym wiedzieć, jak Google obsługuje indeksowanie dużych plików pdf. (600 + strony 25Mb +) Chciałbym wiedzieć, dla tekstu na podstawie pdf. (One nie potrzebują OCR)

Próbowałem wyszukiwań na stronie internetowej dysku i to nie zawsze działa.

Chciałbym wiedzieć, czy są jakieś ograniczenia i jakie one są.

Odpowiedz

3

Według this page dla plików PDF z OCR:

Maksymalny rozmiar zdjęć (.jpg, .gif, .png) i pliki PDF (.pdf) wynosi 2 MB. W przypadku plików PDF patrzymy tylko na pierwsze 10 stron podczas wyszukiwania tekstu do wyodrębnienia.

I this page dla plików PDF z tekstem:

Można wyszukiwać tekst w PDF i plików graficznych przez:

  • wpisując zapytanie w polu wyszukiwania na Dysku Google w internecie.
  • Otwarcie przeglądarki Dysku Google i użycie pola wyszukiwania w prawym górnym rogu.

Teoretycznie powinieneś być w stanie przeszukać pierwsze 100 stron dowolnych dokumentów tekstowych lub tekstowych plików PDF, które zostały przesłane. Będziesz także mógł wyszukiwać tekst znajdujący się na pierwszych dziesięciu stronach wszystkich plików graficznych PDF na Dysku.

+0

Jest to tylko dla plików pdf z opr. Chciałbym dowiedzieć się o tekstowych plikach pdf. – DavidVdd

+0

Dobra uwaga, wydaje mi się, że znalazłem odpowiedź również na tę w mojej zaktualizowanej odpowiedzi. –

+0

Myślę, że te 100 stron jest tylko do wyszukiwania w przeglądarce pdf. – DavidVdd

Powiązane problemy