DApp Store | Web3 Hub tapahtumille ja peleille

Trendaavat aiheet

Omaksuin samankaltaisen generaattori-varmennusmenetelmän mallien käyttöön teoreettisessa fysiikan tutkimuksessa. Tieteen eturintamassa olevat ihmisasiantuntijat voivat parantaa Verifier-malleja niin, että autonominen toiminta on erittäin vahvaa jopa todellisissa tutkimusongelmissa (ei pelkästään keinotekoisissa matemaattisissa kilpailuissa = hyvin asetetut ongelmat, jotka ihmiset voivat ratkaista rajallisessa ajassa). DeepSeekMathV2 Synergia generaattorin ja verifierin välillä Todistusgeneraattori ja varmentaja muodostavat itseparantuvan palautesilmukan. Kun generaattori tuottaa yhä monimutkaisempia todistuksia, ne haastavat varmennustekijän, paljastaen heikkouksia, joista tulee uutta koulutusdataa. Aluksi ihmisasiantuntijat ohjasivat varmistajan uudelleenkoulutusta tarkastelemalla sen merkityt ongelmat — prosessi, joka tehtiin tehokkaaksi tuottamalla useita varmennusyrityksiä per todistus. Tämä "meta-varmennus" (varmennuslaitteen havaintojen tarkistaminen suoran todistusten sijaan) osoittautui sekä helpommaksi ihmisille että helpommaksi LLM:ille. Laajentamalla varmennusanalyysien määrää ja koulutuksen avulla näitä tekoälyavusteisia annotaatioita varmistaja saavutti lopulta luotettavuuden tason, jossa ihmisen puuttumista ei enää tarvittu lopullisissa suorituksissa — sulkien kierre automaattisen todistusaineiston ja verifioinnin välillä.

Tämä kuvaa siirtymää perusgeneraattori-varmennusputkesta, jossa käytetään valmiita malleja, sellaiseen, jossa varmennusohjelmaa on parannettu ihmisen asiantuntijakoulutusdatalla, jota käytetään meta-varmennuksessa.

5,55K

Johtavat

Rankkaus

Suosikit