Jesteśmy studentami próbującymi obsługiwać dane o wielkości około 140 milionów rekordów i próbować uruchomić kilka algorytmów uczenia maszynowego. jesteśmy nowicjuszami w zakresie całych rozwiązań chmurowych i implementacji mahoutów. Obecnie skonfigurowaliśmy je w bazie danych PostgreSQL, ale obecna implementacja nie jest skalowana, a operacje odczytu/zapisu wydają się być bardzo powolne po wielu tuningach wydajności. Dlatego planujemy przejdź do usług opartych na chmurze.Amazon EC2 kontra PiCloud
Przeanalizowaliśmy kilka możliwych alternatyw. Usługi
- Amazon cloud oparte (wdrożenie Kornak)
- Picloud z scikits nauczyć (byliśmy planuje użyć formatu hdf5 z NumPy)
- Proszę polecić jakieś inne alternatywy jeśli w ogóle.
Oto następujące pytania
- Które dają nam lepsze wyniki (zawrócić czasu) i będzie opłacalne? Proszę wspomnieć nam o jakichkolwiek innych dostępnych alternatywach.
- Jeśli założyliśmy serwis Amazon, w jaki sposób mamy mieć format danych? Jeśli użyjemy dynamodb, czy koszty zostaną zwiększone?
Dzięki
Czy możesz wypowiedzieć się na temat możliwości VS AWS PiCloud (Hdf5 z Scikit). –
nie, nie jestem zaznajomiony z PiCloud. – ObscureRobot