Chciałbym zapytać o dane wejściowe na temat najlepszej praktyki w zakresie obsługi zerowych lub pustych wartości danych, jeśli dotyczą one hurtowni danych i SSIS/SSAS.Obsługa wartości null w Datawarehouse
Mam kilka tabel faktów i wymiarów, które zawierają wartości null w różnych wierszach.
Dodatkowo:
1) Jaki jest najlepszy sposób obsłużyć zerowe daty/godziny wartości? Czy powinienem wstawić "domyślny" wiersz w moim czasie lub terminie i wskazać SSIS do domyślnego wiersza, gdy zostanie znaleziona wartość NULL?
2) Jaki jest najlepszy sposób postępowania z wartościami zerowymi/pustymi wartościami w danych wymiaru. Przykład: Mam kilka wierszy w wymiarach "Konta", które mają puste (nie NIŻE) wartości w kolumnie Nazwa konta. Czy należy przekonwertować te puste lub puste wartości wewnątrz kolumny na określoną wartość domyślną?
3) Podobny do punktu 1 powyżej - Co należy zrobić, jeśli kończy się z Facttable wiersza, który nie ma rekord w jednej z kolumn wymiaru? Czy potrzebne są domyślne rekordy wymiarów dla każdego wymiaru, na wypadek gdyby tak się stało?
4) Wszelkie sugestie lub porady dotyczące sposobu obsługi tych operacji w usługach integracyjnych serwera SQL (SSIS)? Najlepsze konfiguracje przepływu danych lub najlepsze obiekty transformacji do użycia będą pomocne.
Dzięki :-)
Ciekawe - Czy wpadł problemów z SSAS pitching dopasowanie o ujemnych wartościach tożsamości? Wiem, że SSAS nienawidzi, gdy jakiś czas temu miałem wartość 0 jako tożsamość. – rrydman
Nie zaczęliśmy jeszcze używać SSAS, zaczniemy używać go za kilka tygodni. Chyba zobaczymy! –
Zrobiłem to samo, ale użyłem tylko 0. Kolumna tożsamości dla wszystkich moich tabel zaczyna się od 1, więc wstawiłem wiersz 0 dla "Nieznany" dla prawie każdej tabeli. Zauważyłem, że nigdy nie było potrzeby stosowania wielu pseudo-członków, więc zawsze mogłem używać 0, co oznacza, że mogłem je zakodować na stałe w ETL, gdy tylko natknąłem się na NULL lub nieudane odnośniki. Oczywiście, czasami NULL ma różne znaczenie, ale wtedy mógłbym zmienić nazwę członka na "Brak", "Nieznany", "Nie dotyczy", lub cokolwiek by to było potrzebne. –