Trend-Themen
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Vor 10 Jahren: der Prompt-Ingenieur für verstärkendes Lernen (RL) [1] (Abschnitt 5.3). Adaptive Denkweise: ein RL-Neuronales Netzwerk lernt, sein "Weltmodell"-Netz für abstraktes Denken und Entscheidungsfindung abzufragen. Über das neuronale Weltmodell von 1990 [2] hinaus, das Millisekunde für Millisekunde plant, und den adaptiven neuronalen Unterzielgenerator von 1991 [3,4] für hierarchische Planung.
[1] J. Schmidhuber (JS, 2015). Über das Lernen zu denken: Algorithmische Informationstheorie für neuartige Kombinationen von RL-Controllern und rekurrenten neuronalen Weltmodellen. ArXiv 1210.0118
[2] JS (1990). Die Welt differenzierbar machen: Über die Verwendung von vollständig rekurrenten selbstüberwachten neuronalen Netzwerken für dynamisches verstärkendes Lernen und Planung in nicht-stationären Umgebungen. TR FKI-126-90, TUM. (Dieser Bericht führte auch künstliche Neugier und intrinsische Motivation durch generative gegnerische Netzwerke ein.)
[3] JS (1991). Lernen, Unterziele für Aktionssequenzen zu generieren. Proc. ICANN'91, S. 967-972.
[4] JS & R. Wahnsiedler (1992). Planung einfacher Trajektorien mit neuronalen Unterzielgeneratoren. Proc. SAB'92, S. 196-202, MIT Press.

Top
Ranking
Favoriten

