Mam aplikację, która wymaga analiz dla różnych poziomów agregacji, i to jest obciążenie OLAP. Chcę też dość często aktualizować swoją bazę danych.Każda skalowalna baza danych OLAP (skala aplikacji internetowej)?
przykład, o to co moja zmiana wygląda (schemat wygląda tak: raz, dest, źródłowy adres IP, przeglądarka -> wizyty)
(15:00-1-2-2010, www.stackoverflow.com, 128.19.1.1, safari) --> 105
(15:00-1-2-2010, www.stackoverflow.com, 128.19.2.1, firefox) --> 110
...
(15:00-1-5-2010, www.cnn.com, 128.19.5.1, firefox) --> 110
A potem chcę zapytać, co jest całkowitą wizyta www .stackoverflow.com z przeglądarki Firefox w zeszłym miesiącu.
Rozumiem, że system Vertica może to zrobić w stosunkowo niedrogi sposób (wydajność i skalowalność są rozsądne, ale prawdopodobnie nie kosztują kosztów). Mam tu dwa pytania.
1) Czy istnieje produkt o otwartym kodzie źródłowym, na którym mogę oprzeć, aby rozwiązać ten problem? W szczególności, jak dobrze działa system Mondrian? (skalowalność i wydajność) 2) Czy istnieje rozwiązanie bazowe HBase lub Hypertable (oczywiście, nagi HBase/Hypertable nie może tego zrobić) do tego? - ale jeśli istnieje projekt oparty na HBase/Hypertable, skalowalność prawdopodobnie nie będzie kwestią IMO)?
Dzięki!
Jaka jest twoja oczekiwana ilość danych? 1 milion odsłon dziennie? 10 milionów? –