Jestem nowy w Hadoop i właśnie zacząłem pracować nad Hive, rozumiem, że zapewnia on język zapytań do przetwarzania danych w HDFS. Dzięki HiveQl
możemy tworzyć tabele i ładować do niego dane z HDFS.Gdzie hive przechowuje swój stół?
Moje pytanie brzmi: gdzie są przechowywane te tabele? W szczególności, jeśli mamy plik 100 GB w naszym HDFS i chcemy utworzyć tabelę ula z tych danych, jaki będzie rozmiar tej tabeli i gdzie jest przechowywany?
Jeśli moje zrozumienie o tej koncepcji jest źle proszę mnie poprawić ..
Co to znaczy "załadować całą tabelę do pamięci i zmapować ją w swoim metaparku"? Hive nie robi nic takiego, kiedy tworzysz zarządzany stół. –
Co wtedy naprawdę się dzieje, gdy ładujemy dane do tabeli ula? – talin
@JeremyBeard Jeśli moja semantyka jest błędna, edytuj post. Jeśli całe pojęcie jest błędne, bardzo chciałbym wiedzieć, gdzie moje zrozumienie nie jest poprawne, dlatego zachęcam do przesłania odpowiedzi. – mlegge