Mam tabelę ula, która jest zbudowana na obciążeniu zewnętrznych plików parkietu. Pliki Paruqet powinny być generowane przez zadanie iskry, ale z powodu ustawienia flagi metadanych na wartość false, nie zostały wygenerowane. Zastanawiam się, czy możliwe jest przywrócenie go w jakiś bezbolesny sposób. Struktura plików jest jak następuje:Generowanie metadanych dla plików parkietu
/apps/hive/warehouse/test_db.db/test_table/_SUCCESS
/apps/hive/warehouse/test_db.db/test_table/_common_metadata
/apps/hive/warehouse/test_db.db/test_table/_metadata
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-20
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-21
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-22
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-23
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-24
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-25
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-26
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-27
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-28
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-29
/apps/hive/warehouse/test_db.db/test_table/end_date=2016-04-30
Załóżmy, że plik _metadata
jest nieistniejącego lub nieaktualne. Czy istnieje sposób na odtworzenie go za pomocą komendy hive/generowanie go bez konieczności rozpoczynania całej pracy iskier?
@Niemand proszę edytować pytanie z najnowszym komentarzem! –
Czy _metadata nie znajdowałby się wewnątrz folderów podzielonych na partycje obok pliku .parquet? Czy możesz również czytać pliki z iskrzaku? –
Tak, niektóre metadane są obecne w samych plikach i tak, są one możliwe do wyśledzenia zarówno ze skorupy iskry, jak i ula. Wydaje mi się, że wyszukiwanie ula jest znacznie wolniejsze bez tego konkretnego pliku _metadata. – Niemand