Przepraszam, jeśli zostało to już zadane (wiem bardzo mało na temat hurtowni danych i jeszcze nie opanowałem słów kluczowych).Agregacja danych - codzienny skrypt SQL a hurtownia danych
Mam tabelę, która rośnie o więcej niż 100 000 wierszy dziennie, każdy wiersz ma znacznik czasu i wiele informacji o produkcie (wymiary, waga, kolor itp.). Poszczególne dane mogą być przydatne przez mniej więcej miesiąc po tym okresie, interesują nas tylko agregacje. Mam dedykowane oprogramowanie, które pozwala na bardziej szczegółową wizualizację poszczególnych wierszy i głównie wykorzystuje PowerPivot do moich potrzeb raportowania.
Mogę wymyślić zapytanie SQL, które będzie codziennie wypełniać nową tabelę: W której będę miał wiersz dla każdej godziny/pozycji/partii i będę podsumowywać informacje (suma/średnia/stddev/etc.)
W ciągu jednego dnia mój skrypt będzie gotowy i będę mógł używać powerpivot na tym nowym stole. Wszystko to w czasie, gdy czuję się komfortowo: zwykły stary SQL.
Z kilku informacji, które zebrałem czytając o DataWarehouse i BI, to, co zaraz zrobię, brzmi bardzo podobnie do tworzenia wymiarów i faktów. Moje pytanie brzmi więc: czy warto dalej badać w tym kierunku (BI), albo ponieważ mój problem jest stosunkowo prosty, lepiej byłoby zostać w relacyjnej bazie danych.
N.B. Raporty, które są tworzone, są zwykle łączone z inną bazą danych w celu uzyskania bardziej znaczących informacji. Zadanie bardzo dobrze wykonane przez Powerpivot.
Gdybym mógł zaakceptować wszystkie odpowiedzi, zrobiłbym to, ponieważ wszyscy przedstawili różne aspekty, które pomogły mi podjąć decyzję (pozwala na razie zachować prostotę). Ale odkąd ten wskazywał mi na więcej czytania, pójdę dalej i zaakceptuję to. Dzięki – Benoittr