Używam sieci neuronowej zbudowanej z 4 neuronów wejściowych, 1 ukrytej warstwy zbudowanej z 20 neuronów i warstwy wyjściowej 7 neuronów.Sieć neuronowa z tanh niewłaściwym nasyceniem ze znormalizowanymi danymi
Próbuję wyszkolić go na algorytm bcd do 7 segmentów. Moje dane normalizuje 0 -1 i 1 to 1.
Gdy ocena błąd wyjścia nastąpi, neuron nasyca źle. Jeśli żądanym wyjściem jest 1
, a rzeczywistym wyjściem jest -1
, błąd wynosi 1-(-1)= 2
.
Po pomnożeniu przez pochodną funkcji aktywacji error*(1-output)*(1+output)
, błąd staje się prawie 0
Z powodu 2*(1-(-1)*(1-1)
.
Jak mogę uniknąć tego błędu nasycenia?
Więc to może być po prostu nie moja domena ale nie mam bladego pojęcia, jak to jest możliwe, aby rozwiązać ten z podanych informacji.Nie wiem też, czy "tan" to literówka czy hiperboliczna styczna. – djechlin
tanh jest hangboliczny styczny :) – PVJ