Trend Olan Konular
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
10 yıl önce: güçlendirme öğrenme (RL) prompt mühendisi [1] (Sec. 5.3). Adaptif düşünce zinciri: Bir gerçek yaşam sinir ağı, soyut akıl yürütme ve karar verme için "dünya modeli" ağını sorgulamayı öğrenir. 1990 sinir dünya modelinin [2] milisaniye milisaniye planlamasının ve 1991 uyarlanabilir sinirsel alt hedef üreteci [3,4] hiyerarşik planlamanın ötesine geçiyor.
[1] J. Schmidhuber (JS, 2015). Düşünmeyi Öğrenmek Üzerine: RL Kontrolörlerinin ve Tekrarlayan Sinir Dünya Modellerinin Yeni Kombinasyonları İçin Algoritmik Bilgi Teorisi. ArXiv 1210.0118
[2] JS (1990). Dünyayı Farklılaştırılabilir Etmek: Dinamik pekiştirme öğrenme ve planlama için tam tekrarlı kendi kendini denetleyen sinir ağlarının kullanımı üzerine durağan olmayan ortamlarda. TR FKI-126-90, TUM. (Bu rapor ayrıca üretken düşman ağları aracılığıyla yapay merak ve içsel motivasyonu da tanıtmıştır.)
[3] JS (1991). Aksiyon sahneleri için alt hedefler oluşturmayı öğrenmek. Dosya ICANN'91, s. 967-972.
[4] JS & R. Wahnsiedler (1992). Sinirsel alt hedef üreteçleri kullanarak basit yörüngeler planlamak. Proc. SAB'92, s. 196-202, MIT Press.

En İyiler
Sıralama
Takip Listesi

