- Apache Apex silnik do przetwarzania danych strumieniowych. Niektóre inne, które próbują osiągnąć to samo, to burza Apache, migotanie Apache. Innym czynnikiem wyróżniającym Apache Apex jest: wbudowane wsparcie dla odporności na błędy, skalowalności i skupienia na funkcjonalności, które są kluczowymi czynnikami w przypadku użycia produkcyjnego.
Porównanie ze Spark: Apache Spark jest w rzeczywistości przetwarzaniem wsadowym. Jeśli weźmiesz pod uwagę transmisję Spark (która używa iskry pod spodem), to jest przetwarzanie mikrokontrolowane. W przeciwieństwie do Apache apex jest prawdziwym przetwarzaniem strumienia. W pewnym sensie, rekord przychodzący NIE musi czekać na następny rekord do przetworzenia. Rekord jest przetwarzany i wysyłany do następnego poziomu przetwarzania, gdy tylko nadejdzie.
Obecnie trwają prace postępu na dodanie wsparcia dla integracji Apache Apex z bibliotekami uczenia maszynowego, takich jak Apache Samoa, H2O odnoszą https://issues.apache.org/jira/browse/SAMOA-49
Obecnie posiada wsparcie dla Java, Scala.
https://www.datatorrent.com/blog/blog-writing-apache-apex-application-in-scala/ Dla Pythona, możesz wypróbować to używając Jython. Ale nie próbowałem tego sam. Więc nie jestem tego pewien.
Integracja ze Spark może nie być dobrym pomysłem, ponieważ są to dwa różne silniki przetwarzania. Jednak integracja Apache apex z bibliotekami uczenia maszynowego jest w toku.
Jeśli masz jakiekolwiek inne pytania, prośby o funkcje można zamieszczać je na liście dyskusyjnej dla Apache użytkowników wierzchołkowych: https://mail-archives.apache.org/mod_mbox/incubator-apex-users/
prostu zastanawiasz się, dlaczego ten dostał się głosowanie! – daemon12
To samo tutaj. Jestem w szoku, widząc tak wiele głosów negatywnych. Czy ktoś może wyjaśnić? To bardzo konkretne pytanie. –
bardzo szczegółowe porównanie tutaj http://www.slideshare.net/ApacheApex/architectual-comparison-of-apache-apex-and-spark-streaming – ashwin111