Dostępne są trzy typy operacji, które może wykonać zapytanie w ulu.
W kolejności od najtańszych i najszybszych do droższych i wolniejszych tutaj.
Kwerenda w kopcu może być żądaniem tylko metadanych.
Pokaż tabele, opisują tabelę są przykładami. W tych kwerendach proces ula wykonuje wyszukiwanie w serwerze metadanych. Serwer metadanych to baza danych SQL, prawdopodobnie MySQL, ale faktyczna baza danych jest konfigurowalna.
Kwerenda w kopcu może być żądaniem hdfs. Wybierz * z tabeli, będzie przykładem. W tym przypadku gałąź może zwrócić wyniki, wykonując operację hdfs. hadoop fs -get, mniej więcej.
Zapytanie o ula może być zadaniem Zmniejsz mapę.
Hive musi wysłać słoik do hdfs, jobtracker kolejkuje zadania, tasktracker wykonuje zadania, ostateczne dane są umieszczane w hdfs lub wysyłane do klienta.
Mapa Zmniejszenie liczby zadań ma również inne możliwości.
Może to być zadanie wyłącznie na mapie. Wybierz * z tabeli, gdzie id> 100, na przykład cała ta logika może zostać zastosowana w programie odwzorowującym.
Może to być zadanie Map i Reduce, Wybierz min (id) z tabeli; Wybierz * z kolejności według identyfikatora;
Może to również prowadzić do wielu map Zmniejszyć liczbę przejść, ale myślę, że powyższe podsumowuje niektóre zachowania.
Coś mi mówi, że AlexHenderson_v1.00 odpowiadał na niewłaściwe pytanie. –
Nie. Komentarz musiał zostać zredagowany po mojej odpowiedzi. Coś mi mówi, że źle przeliterowałeś moje imię. –