Jestem nowy w pliku ORC. Przeszedłem przez wiele blogów, ale nie zrozumiałem dokładnie. Prosimy o pomoc i wyjaśnienie poniższych pytań.Plik ORC Hadoop - jak to działa - jak pobrać metadane
Czy mogę pobrać schemat z pliku ORC? Wiem, że w Avro schemat można pobrać.
W jaki sposób zapewnia on ewolucję schematu? Wiem, że można dodać kilka kolumn. Ale jak to zrobić. Jedyne, co wiem, to tworzenie pliku orc poprzez ładowanie danych do tabeli hive, które przechowują dane w formacie orc.
Jak działa indeks plików ORC? Wiem tylko, że każdy indeks paska zostanie zachowany. Ale jak plik nie jest posortowany, jak to pomaga wyszukiwać dane na liście pasków. Jak pomaga w pomijaniu pasków przy wyszukiwaniu danych?
Czy indeks jest utrzymywany dla każdej kolumny. Jeśli tak, to czy nie zużyje więcej pamięci?
W jaki sposób plik ORC formatu kolumnowego może zmieścić się w tabeli ula, gdzie wartości poszczególnych kolumn są przechowywane razem. mając na uwadze, że tablica ula jest tworzona w celu uzyskania rekordu według rekordu. Jak oba będą pasować do siebie?