hadoop

    18Ciepło

    8Odpowiedz

    Muszę zapisywać dane w Hadoop (HDFS) z zewnętrznych źródeł, takich jak okna systemu Windows. W tej chwili kopiowałem dane do namenodu i stosowałem polecenie put HDFS, aby je zaimportować do klastra. P

    5Ciepło

    2Odpowiedz

    W ciągu ostatnich kilku tygodni pracowałem z komputerowymi bibliotekami programowania Apache Mahout w moim wolnym czasie. Jestem ciekawy, jak inni korzystają z tych bibliotek.

    7Ciepło

    3Odpowiedz

    Używanie tylko odwzorowania (skryptu Python) i bez reduktora, w jaki sposób można wyprowadzić osobny plik z kluczem jako nazwą pliku, dla każdego wiersza wyjścia, zamiast długich plików wyjściowych ?

    14Ciepło

    7Odpowiedz

    Jak mogę wymazać DFS w Hadoop?

    25Ciepło

    5Odpowiedz

    W przeszłości tworzyłem WebAnalytics przy użyciu kostek OLAP działających na MySQL. Teraz kostka OLAP, tak jak jej użyłem, to po prostu duży stół (ok, był przechowywany nieco mądrzejszy), gdzie każdy

    8Ciepło

    4Odpowiedz

    Biorąc pod uwagę scenariusz następujący schemat HBase (from the official FAQ) ... Jak można zaprojektować tabelę HBase dla wielu-do-wielu stowarzyszenie między dwa podmioty, na przykład studentów i Ki

    11Ciepło

    10Odpowiedz

    Chciałbym analizować ciągły strumień danych (dostęp za pośrednictwem protokołu HTTP) przy użyciu podejścia MapReduce, więc zajmuję się Apache Hadoop. Niestety wygląda na to, że Hadoop spodziewa się, ż

    51Ciepło

    3Odpowiedz

    Pracuję nad projektem wykorzystującym Hadoop i wydaje się on natywnie zawierać Java i zapewnia obsługę przesyłania strumieniowego dla Pythona. Czy wybór jednego z nich ma wpływ na wydajność? Jestem wy

    5Ciepło

    2Odpowiedz

    Czy ktoś ma jakieś pojęcie o pracy zarówno z CloudStore i HDFS. Chciałbym zobaczyć, jak daleko skaluje się CloudStore i jak intensywnie zostało użyte w produkcji. CloudStore wydaje się być w pełni fun

    8Ciepło

    3Odpowiedz

    Sekcja Task Side-Effect Files samouczka Hadoop wymienia użycie "próby" zadania jako unikatowej nazwy. Jak uzyskać ten identyfikator ID próby w moim programie odwzorowującym lub redukującym?