Etsin henkilöä, jolla on kokemusta tulosten palkitsemismallien ja PRM:ien toteuttamisesta (tai vain korkealaatuisesta esimerkistä) tai koodista, joka auttaa parantamaan palkitsemismallin lukua RLHF-kirjassa. DM tai lähetä minulle sähköpostia, jos se olet sinä tai sinulla on osoitin.