2009-06-20 23 views
9

Dla osób, które wdrożyły HBase w swoich własnych klastrach, czy uważają Państwo, że jest wystarczająco stabilny do wykorzystania w produkcji? Z jakimi typami problemów lub problemów napotkasz?Czy HBase jest stabilny i gotowy do produkcji?

Widzę kilka firm wymienionych jako używające HBase w produkcji (http://wiki.apache.org/hadoop/Hbase/PoweredBy), ale jestem ciekawy, czy wiele konserwacji, łatania i odpalenia idzie do utrzymywania i uruchamiania klastra HBase.

Odpowiedz

10

HBase wkrótce stanie się kamieniem milowym z HBase-0.20. Jest tam alfa i wkrótce będzie to RC. Ma bardzo duże ulepszenia wydajności. StumbleUpon podobno udostępnia swoją witrynę na żywo w wersji bagażnika HBase, bez dodatkowej warstwy buforowania, podobnie jak inne. Powiedziałbym więc, że zdecydowanie jest gotowy do użycia w produkcji.

Ryan Rawson (z StumbleUpon) podał ostatnio na konferencji noseql nice talk, co w większości dotyczy tego, jak daleko zaszło w ciągu ostatnich 6 miesięcy. Są slajdy, jeśli nie chcesz oglądać całości. Oprócz poprawy wydajności, innym ważnym dodatkiem jest to, że integruje się teraz z zookeeperem, więc mistrz nie jest już pojedynczym punktem awarii.

HBaza, która z uwagi na ograniczenia formatu pliku spadła z powodu małych rozmiarów komórek z problemami z pamięcią. Zostało to również zaadresowane z nowym niestandardowym formatem plików, który również przyniósł wzrost wydajności.

Eksperymentowałem z HBase już od około roku, jestem gotowy zaufać 0.20 z usługą produkcyjną, nie byłem całkiem w starszych wersjach. Podczas eksperymentowania zalecałem co najmniej 4 lub 5-węzłowy program typu devcluster.

Nie mogę wypowiedzieć się na temat tego, jak wygląda opieka nad klastrem produkcyjnym, ponieważ dopiero zaczęliśmy produkcję. Aspektem, który pomaga, jest to, że lista mailingowa jest niezwykle aktywna i irc jest w ciągłym użyciu, więc istnieje bardzo silna społeczność, która przynajmniej pomaga.

Powiązane problemy