2015-07-20 11 views
6

Jak stworzyć SparseVector i gęsty Vector reprezentacji dlaRzadki Wektor vs Gęsta Vector

jeśli DenseVector jest:

denseV = np.array([0., 3., 0., 4.]) 

Jaki będzie reprezentację Rzadki Vector?

+1

Dla tych, którzy czytają tytuł "Sparse Vector vs Gęsta wektor" i szukali wyjaśnienia, kiedy użyć którego [ta odpowiedź] (http: // stackoverflow. com/a/26706528/877069) ma informacje, których szukasz. –

Odpowiedz

11

ile mam dokładnie zrozumiał swoje wątpliwości MLlib data type documentation ilustruje to całkiem wyraźnie:

import org.apache.spark.mllib.linalg.Vector; 
import org.apache.spark.mllib.linalg.Vectors; 

// Create a dense vector (1.0, 0.0, 3.0). 
Vector dv = Vectors.dense(1.0, 0.0, 3.0); 
// Create a sparse vector (1.0, 0.0, 3.0) by specifying its indices and values corresponding to nonzero entries. 
Vector sv = Vectors.sparse(3, new int[] {0, 2}, new double[] {1.0, 3.0}); 

Jeżeli drugi argument Vectors.sparse jest tablicą wskaźników, a trzeci argument jest tablicą wartości rzeczywistych w tych indeksach.

+0

Och, nie przekazałem właściwej liczby indeksów. SparseV = SparseVector (4, [0, 1, 2, 3], [0., 3., 0., 4.]) –

+1

jakie jest znaczenie kropki po numerze tj. 1.? –

+1

Kropka wskazuje tylko typ zmiennoprzecinkowy. '1.' jest równoważne' 1.0' –

5

Wektory rzadkie występują wtedy, gdy w wektorze występuje wiele wartości jako zero. Podczas gdy gęsty wektor występuje wtedy, gdy większość wartości w wektorze jest niezerowa.

Jeśli trzeba utworzyć rzadki wektor z gęstym wektorem określonym, należy użyć następującej składni:

Vector sparseVector = Vectors.sparse(4, new int[] {1, 3}, new double[] {3.0, 4.0}); 

Poniższy link jest bardzo przydatna dla uzyskania dobrego zrozumienia ogólnej koncepcji.

http://techchai.com/2017/03/13/sparse-vectors-in-apache-spark/

Dzięki