Tworzę sieć neuronową za pomocą techniki backpropagation do nauki.Pochodne sigmoid
Rozumiem, że musimy znaleźć pochodną użytej funkcji aktywacji. Używam standardowych funkcji esicy
f(x) = 1/(1 + e^(-x))
i widziałem, że jej pochodna jest
dy/dx = f(x)' = f(x) * (1 - f(x))
To może być daft pytanie, ale czy to oznacza, że musimy zdać X poprzez funkcja esicy dwa razy w równaniu więc rozwinie się do
dy/dx = f(x)' = 1/(1 + e^(-x)) * (1 - (1/(1 + e^(-x))))
czy jest to po prostu kwestia przy już obliczoną wyjście f(x)
, który stanowi sygnał wyjściowy neuronu i zastąpić tę wartość dla f(x)
?
Sugerowałbym próbę samodzielnego zastosowania pochodnej. Z odrobiną algebry możesz uzyskać dokładnie f (x) * (1 - f (x)), a wtedy zrozumiesz dokładnie, co się dzieje. (I odpowiedź poniżej jest w 100% poprawna.) –
pomyśl o swoim pierwotnym problemie pod względem podstawienia, a zobaczysz, że f (x) jest częstym określeniem, które możesz odmienić przez podstawienie –