10 yıl önce: güçlendirme öğrenme (RL) prompt mühendisi [1] (Sec. 5.3). Adaptif düşünce zinciri: Bir gerçek yaşam sinir ağı, soyut akıl yürütme ve karar verme için "dünya modeli" ağını sorgulamayı öğrenir. 1990 sinir dünya modelinin [2] milisaniye milisaniye planlamasının ve 1991 uyarlanabilir sinirsel alt hedef üreteci [3,4] hiyerarşik planlamanın ötesine geçiyor. [1] J. Schmidhuber (JS, 2015). Düşünmeyi Öğrenmek Üzerine: RL Kontrolörlerinin ve Tekrarlayan Sinir Dünya Modellerinin Yeni Kombinasyonları İçin Algoritmik Bilgi Teorisi. ArXiv 1210.0118 [2] JS (1990). Dünyayı Farklılaştırılabilir Etmek: Dinamik pekiştirme öğrenme ve planlama için tam tekrarlı kendi kendini denetleyen sinir ağlarının kullanımı üzerine durağan olmayan ortamlarda. TR FKI-126-90, TUM. (Bu rapor ayrıca üretken düşman ağları aracılığıyla yapay merak ve içsel motivasyonu da tanıtmıştır.) [3] JS (1991). Aksiyon sahneleri için alt hedefler oluşturmayı öğrenmek. Dosya ICANN'91, s. 967-972. [4] JS & R. Wahnsiedler (1992). Sinirsel alt hedef üreteçleri kullanarak basit yörüngeler planlamak. Proc. SAB'92, s. 196-202, MIT Press.