2016-07-26 12 views
14

W definicji tf.nn.max_pool, do czego służy ksize?Użycie ksize w tf.nn.max_pool

tf.nn.max_pool(value, ksize, strides, padding, data_format='NHWC', name=None) 

Performs the max pooling on the input. 

Args: 

value: A 4-D Tensor with shape [batch, height, width, channels] and type tf.float32. 
ksize: A list of ints that has length >= 4. The size of the window for each dimension of the input tensor. 

Na przykład, jeśli input value jest tensor : [1, 64, 64, 3] i ksize=3 .Co to znaczy?

+0

Maksymalnie zajmuje obszar o rozmiarze ksize (rozmiar jądra). –

+0

Zgodnie z opisem, ksize przechwytuje rozmiar okna dla każdego wymiaru tensora wejściowego. Jeśli wielkość partii = 6, ksize = 3, oznacza to, że maxmum zostanie wykonane na 3 partiach dla danego jądra puli? – user288609

Odpowiedz

28

W documentation stany:

ksize: wykaz wskazówki, które ma długość> = 4. rozmiar okna dla każdego wymiaru tensora wejściowego.

Ogólnie rzecz biorąc, obraz ma kształt [batch_size, 64, 64, 3] dla obrazu RGB o wymiarach 64x64 pikseli.

Rozmiar jądra ksize będzie zazwyczaj [1, 2, 2, 1], jeśli masz okno 2x2, powyżej którego bierzesz maksimum. W wymiarze wymiaru wsadu i wymiarze kanału, ksize jest 1, ponieważ nie chcemy brać maksimum na wiele przykładów lub na wiele kanałów.