Vor 10 Jahren: der Prompt-Ingenieur für verstärkendes Lernen (RL) [1] (Abschnitt 5.3). Adaptive Denkweise: ein RL-Neuronales Netzwerk lernt, sein "Weltmodell"-Netz für abstraktes Denken und Entscheidungsfindung abzufragen. Über das neuronale Weltmodell von 1990 [2] hinaus, das Millisekunde für Millisekunde plant, und den adaptiven neuronalen Unterzielgenerator von 1991 [3,4] für hierarchische Planung. [1] J. Schmidhuber (JS, 2015). Über das Lernen zu denken: Algorithmische Informationstheorie für neuartige Kombinationen von RL-Controllern und rekurrenten neuronalen Weltmodellen. ArXiv 1210.0118 [2] JS (1990). Die Welt differenzierbar machen: Über die Verwendung von vollständig rekurrenten selbstüberwachten neuronalen Netzwerken für dynamisches verstärkendes Lernen und Planung in nicht-stationären Umgebungen. TR FKI-126-90, TUM. (Dieser Bericht führte auch künstliche Neugier und intrinsische Motivation durch generative gegnerische Netzwerke ein.) [3] JS (1991). Lernen, Unterziele für Aktionssequenzen zu generieren. Proc. ICANN'91, S. 967-972. [4] JS & R. Wahnsiedler (1992). Planung einfacher Trajektorien mit neuronalen Unterzielgeneratoren. Proc. SAB'92, S. 196-202, MIT Press.