det er enkelt å spore hva som kommer til å drive RL env-skaping og hvordan verdi vil bli fanget opp fra det - bare se på hvordan vi evaluerer og foreskriver verdi til menneskelige problemer + løsninger, det vil ikke være mye annerledes
1,62K