Pytorch gestapelt RNN

Was ist gestapelt RNN?
Warum LSTM besser ist als RNN?
Was ist versteckte Größe in RNN Pytorch?

Was ist gestapelt RNN?

Stapeln von RNNs bedeutet einfach, die Ausgabe einer RNN -Schicht auf eine andere RNN -Schicht zu füttern. Die RNN -Ebenen können Sequenzen ausgeben (dh zu jedem Zeitschritt ausgeben) und diese können wie jede Eingangssequenz in die nachfolgende RNN -Schicht gefüttert werden.

Warum LSTM besser ist als RNN?

LSTM-Netzwerke bekämpfen die verschwindenden Gradienten oder langfristigen Abhängigkeitsprobleme des RNN. Gradientalishing bezieht sich auf den Verlust von Informationen in einem neuronalen Netzwerk, da die Verbindungen über einen längeren Zeitraum wiederkommen. In einfachen Worten weist LSTM das Verschwinden von Gradienten an, indem sie nutzlose Daten/Informationen im Netzwerk ignoriert.

Was ist versteckte Größe in RNN Pytorch?

HIDDEN_SIZE - Die Anzahl der Merkmale im versteckten Zustand h. num_layers - Anzahl der wiederkehrenden Schichten. E.g., Einstellung num_layers = 2 würde bedeuten, dass zwei RNNs zusammen stapeln, um einen gestapelten RNN zu bilden, wobei das zweite RNN die Ausgänge des ersten RNN aufnimmt und die endgültigen Ergebnisse berechnet. Standard: 1.