*Stort* open source AI-släpp idag. Kan Amerika vinna Open AI-racet? Mitt samtal med @natolambert och @soldni av @allen_ai om lanseringen av Olmo 3 00:00 – Cold Open 00:39 – Välkommen och dagens stora tillkännagivande 01:18 – Introduktion av Olmo 3-modellfamiljen 02:07 – Vad "basmodeller" egentligen är (och varför de är viktiga) 05:51 – Dolma 3: datan bakom Olmo 3 08:06 – Uppträdande mot Qwen, Gemma, DeepSeek 10:28 – Vad sann öppen källkod betyder (och varför den är sällsynt) 12:51 – Mellanliggande kontrollpunkter, transparens och varför AI2 publicerar allt 16:37 – Varför Qwen finns överallt (inklusive amerikanska startups) 18:31 – Varför kinesiska laboratorier blir open source (och varför amerikanska laboratorier inte gör det) 20:28 – Inside ATOM: USA:s svar på Kinas modelluppsving 22:13 – Framväxten av "tänkande modeller" och skalning av inferenstid 35:58 – Hela Olmo-pipelinen, förklarad enkelt 46:52 – Förträning: data, skala och undvika katastrofala toppar 50:27 – Mitt i träningen (svanspatchning) och undvikande av testläckage 52:06 – Varför långtids-träning är viktig 55:28 – SFT: bygga grunden för resonemang 1:04:53 – Inställning av preferenser och varför DPO fortfarande fungerar 1:10:51 – Den svåra delen: RLVR, långa resonemangskedjor och infrastruktursmärta 1:13:59 – Varför RL är så tekniskt brutalt 1:18:17 – Komplexitetsskatt vs AGI-hype 1:21:58 – Hur alla kan bidra till AI:s framtid 1:27:26 – Avslutande tankar
... öppen **källkod** AI-ras, d'oh 🤦 ♂️
33,58K