2010-05-12 13 views

Odpowiedz

9

Najpierw możesz przeczytać niektóre dokumenty związane z MapReduce i rozproszonym przetwarzaniem, aby lepiej to zrozumieć. Oto niektóre chciałbym polecić:

Z drugiej strony, jeśli chcesz wiedzieć lepiej od Hadoop, może można zacząć czytać Hadoop MapReduce kod źródłowy ramy.

3

Obecnie bookwise chciałbym sprawdzić - Hadoop A Definitive Guide. Jest napisany przez Toma White'a, który pracuje już od dłuższego czasu i pracuje w Cloudera z Doug Cutting (twórcą Hadoop).

Również po stronie darmowej Jimmy Lin z UMD napisał książkę pod tytułem: Data-Intensive Text Processing with MapReduce. Oto link do ostatecznej wersji przedprodukcyjnej (link podany przez autora na jego website).

1

MIT 6.824 to najlepsze rzeczy. Jedynie czytanie gazet Google związanych z Hadoopem nie wystarczy. Systematyczne uczenie się jest wymagane, jeśli chcesz wejść głębiej.

2

Hadoop niekoniecznie jest najlepszym narzędziem do rozwiązywania wszystkich problemów związanych z przetwarzaniem rozproszonym. Pomimo swojej mocy ma także bardzo stromą krzywą uczenia się i koszty posiadania. Możesz chcieć wyjaśnić swoje wymagania i szukać odpowiednich alternatyw w świecie Java, takich jak HTCondor, JPPF lub GridGain (moje przeprosiny dla tych, których nie wspomnę).

1

Jeśli szukasz wiedzy na temat rozproszonej platformy obliczeniowej, która jest mniej skomplikowana niż Hadoop, możesz wypróbować Zillabyte. Aby zbudować aplikacje na platformie, musisz znać tylko Ruby lub Pythona.

Jak powiedział LoLo, Hadoop jest potężnym rozwiązaniem, ale na początku może być trudne.

Aby uzyskać informacje na temat materiałów rozproszonych, należy wypróbować numer http://ocw.mit.edu/courses/electrical-engineering-and-computer-science/6-824-distributed-computer-systems-engineering-spring-2006/syllabus/. W kursie jest także kilka zasobów rekomendowanych.

Powiązane problemy