Buduję swoją pierwszą bazę danych w SQL 2008/SSIS i szukam najlepszych praktyk związanych z ładowaniem tabel faktów.SQL/SSIS DataWareHouse Ładowanie tabeli faktów, sprawdzone metody?
Obecnie w moim DW mam około 20 wymiarów (biura, pracownicy, produkty, klient, itp.), Które są typu 1 SCD. W mojej konstrukcji dw, istnieje kilka rzeczy, które zostały już zastosowane:
- Brak wartości null (zastąpione puste dla tekstu lub 0 dla numeryczne podczas postoju)
- nieznanych kluczowych członków zaludnionych w każdym wymiarze (SK ID 0)
- upsert dla SCD Type 1 załadunkiem od etapu do stołu produkcyjnego
- SELECT DISTINCT dla mojego załadunku wymiarach
W moim projekcie Fact loading SSIS, obecna metoda mam do wymiarów ładowania jest mając wiele wyszukiwań (20+) do każdego z modułów DIM, a następnie wypełniając tabelę FACT danymi.
Dla moich wyszukiwań ustawić:
- Pełna Cache
- ignorowanie niepowodzeń "żadne pasujące wpisy"
- Pochodzące Transformacja "ISNULL (surrogate_idkey) 0: surrogate_idkey" dla każdego SK tak że jeśli wyszukiwania się nie powiodą, domyślnie przyjmą SK ID 0 (nieznany członek).
- Niektóre z moich wyszukiwań wymiarowych mieć więcej niż jednej firmy kluczowego
Jest to najlepsze podejście? Załączam zdjęcia, aby pomóc w powyższym opisie.
Dzięki Banton, aktualnie ładujemy (pełny zrzut) rekordy 4m, które zawierają około 200 kolumn; i około 2k wierszy nowych rekordów każdego dnia; etap ładowania jest dość szybki. Dzięki za opinie. – exxoid
[Proszę PODĄŻAĆ, KORZYSTAĆ I UDOSTĘPNIĆ inicjatywę dedykowanej witryny BI.] (Http://area51.stackexchange.com/proposals/70503/business-intelligence?referrer=EPHSm8-3avvaMxLjdRIeNg2). Po raz pierwszy poruszyłem to pytanie w [Meta, gdy nie było propozycji stron BI.] (Http://meta.stackexchange.com/q/232414/201662) – bonCodigo