Czy są jakieś alternatywne paradygmaty dla MapReduce (Google, Hadoop)? Czy istnieje jakikolwiek inny rozsądny sposób podziału dużych problemów z połączeniem &?MapReduce alternatives
Odpowiedz
Definitively. Sprawdź na przykład Bulk Synchronous Parallel. Map/Reduce jest w rzeczywistości bardzo ograniczonym sposobem zmniejszania problemów, jednak ograniczenie to umożliwia zarządzanie w ramach takich jak Hadoop. Pytanie brzmi, czy nie ma problemu, aby wcisnąć swój problem w ustawienie Map/Reduce, lub czy łatwiej jest stworzyć schemat równoległy specyficzny dla konkretnej domeny i samemu zająć się wszystkimi szczegółami implementacji. Pig to w rzeczywistości tylko warstwa abstrakcji na szczycie Hadoop, która automatyzuje wiele standardowych transformacji problemowych z funkcji nie-Map-Reduce-y na Map-Reduce.
Edit 26.01.13: znalaz? nice up-to-date overview here
[Apache Hama] (http://incubator.apache.org/hama/) implementuje BSP. Hama został przeniesiony do [YARN (Yet Another Resource Manager)] (http://wiki.apache.org/hama/GettingStartedYARN), który jest częścią Hadoop 0.23. Sprawdź to [blog] (http://codingwiththomas.blogspot.com/) na Apache Hama. –
Dzięki Praveen;) Odwiedź naszą stronę internetową i wiki, aby uzyskać więcej informacji o hama http://incubator.apache.org/hama/ –
Phil Colella zidentyfikowano siedem metod numerycznych do obliczeń naukowych na podstawie wzorców rozpraszania i zbierania danych pomiędzy węzłami przetwarzania, i nazwał je „krasnoludki”. Zostały one dodane do przez innych, wykaz dostępny jest na Dwarf Mine:
- Gęsty Linear Algebra
- Rzadki algebra liniowa
- Metody widmowe Metod
- N-Body
- strukturyzowane Siatki
- Siatki niestrukturalne
- MapReduce
- Kombinatkowy Logi c
- Graph Traversal
- programowania dynamicznego
- Backtrack i rozgałęzienia i związanego
- graficzne Modele Machines
- Finite State
Microsoft Dryad jest uważana za bardziej ogólne niż MapReduce.
Aktualizacja (sierpień 2014): Stratosfera nazywa się teraz Apache Flink (inkubacja).
Spójrz na Stratosphere. Jest to kolejne środowisko uruchomieniowe Big Data, które oferuje więcej operatorów (mapowanie, redukowanie, łączenie, łączenie, krzyżowanie, iteracja, ...). Pozwala również na definiowanie zaawansowanych wykresów przepływu danych (przy Hadoop MR, będziesz musiał łączyć zadania).
Stratosphere obsługuje również BSP z jego abstrakcją przetwarzania wykresu (o nazwie Spargel).
Jeśli chcesz przeczytać artykuły naukowe, spójrz na Nephele/PACTs: A Programming Model and Execution Framework for Web-Scale Analytical Processing, wyjaśnia teoretyczne podstawy systemu.
Kolejny system w tej dziedzinie to Spark, który ma swój własny model (RDD). Ponieważ wspomniano tu o BSP, warto również zapoznać się z ofertą GraphLab, która jest alternatywą dla BSP.
- 1. ActiveAdmin Alternatives
- 2. update-alternatives: ostrzeżenie:/etc/alternatives/java jest zwisający
- 3. Java GUI alternatives
- 4. Grails: Alternatives to Grails Doc?
- 5. Rails Enumerated Types lub Alternatives
- 6. Hadoop MapReduce: Kierowca łańcuchowym mappers w pracy MapReduce
- 7. Co to znaczy: [alternatives --config mta]?
- 8. Dostępne reduktory w elastycznej MapReduce
- 9. Parallelizing the "Reduce" w "MapReduce"
- 10. Hadoop MapReduce plików Multiple Input
- 11. Jak interpretować MapReduce wydajności Liczniki
- 12. MapReduce w MongoDB nie wypuszcza
- 13. MapReduce i SQL GROUP BY
- 14. Hadoop: Jak działa OutputCollector podczas MapReduce?
- 15. Jak debugować hadoop mapreduce zadania od Eclipse?
- 16. Rozproszony algorytm współczynnika lokalnego skupiania (MapReduce/Hadoop)
- 17. Znajdowanie połączonych komponentów przy użyciu Hadoop/MapReduce
- 18. Chaining Wielu Redukcje w pracy Hadoop MapReduce
- 19. Łańcuchowanie Hadoop MapReduce z potokami (C++)
- 20. Konfigurowanie zewnętrznego źródła danych dla Elastic MapReduce
- 21. Różnice między istniejącymi MapReduce i YARN (MRv2)
- 22. Błąd w ustawianiu job.setInputFormatClass w Mapreduce
- 23. MapReduce - Jak sortować dane wyjściowe według wartości
- 24. Hadoop MapReduce zapewnić zagnieżdżonych katalogów jako wkład pracy
- 25. Zrozumienie algorytmu mapreduce do obliczania zachodzenia na siebie
- 26. Uzyskaj liczbę wejść i wyjść MapReduce w Javie
- 27. MapReduce za pomocą SQL Server jako źródła danych
- 28. Nie można uruchomić zadania MapReduce na hadoop 2.4.0
- 29. Jak uniknąć przekroczenia limitu czasu kursora w długiej operacji mapreduce?
- 30. Wyniki MapReduce wydają się być ograniczone do 100?
MapReduce nie jest algorytmem ani paradygmatem, to technologia. –
@ralu: Istnieje wiele sposobów radzenia sobie z dużymi problemami.MapReduce DEFINITIALY jest tylko jednym z nich i ZDECYDOWANIE jest zarówno paradygmatem, jak i algorytmem. Również jego implementacja staje się technologią, ale nie jestem zainteresowany implementacjami raczej pomysłami. Dziękuję Ci. – Cartesius00
Dlaczego myślisz o swoim problemie jako o podzieleniu i scaleniu? Musisz tylko rozwiązać problem. Na przykład Apache Pig sprzedaje dane za pomocą języka SQL. I nie ma sposobu na podzielenie i scalenie, chociaż może on działać na setkach setek maszyn i wykorzystuje Hadoop jako platformę. –