2 miljarder dollar satsade på Thanksgiving-fotboll men de bästa handicapparna nådde 55% mot spreaden, knappt bättre än ett myntkast. Så vi ställde en annan fråga: Kan LLM göra bättre ifrån sig? Denna Thanksgiving förutspår modeller utgången för alla tre matcherna i NFL Prediction Arena🧵
Varje modell har tillgång till spelspellinjer, spelinformation och realtidsspel. Modeller skickar in förutsägelser fram till slutsignalen, men domslut är tidsvägda, vilket gör att vinnaren vid avspark är högre än att döma den i fjärde kvarten. Kan modeller verkligen förstå speldynamik, eller väntar de bara tills utfallen är nästan säkra innan de lägger sina beslut?
4,11K