*Великий* випуск відкритого ШІ сьогодні. Чи може Америка виграти гонку Open AI? Моя розмова з @natolambert і @soldni @allen_ai про запуск Olmo 3
00:00 – Холодне відкриття
00:39 – Ласкаво просимо та сьогоднішнє велике оголошення
01:18 – Представляємо сімейство моделей Olmo 3
02:07 – Що таке «базові моделі» насправді (і чому вони важливі)
05:51 – Долма 3: дані за Ольмо 3
08:06 – Виступ проти Qwen, Gemma, DeepSeek
10:28 – Що означає справжній відкритий код (і чому він рідкісний)
12:51 – Контрольні точки середнього рівня, прозорість і чому AI2 публікує все
16:37 – Чому Qwen всюди (включаючи американські стартапи)
18:31 – Чому китайські лабораторії переходять на відкритий код (і чому американські лабораторії ні)
20:28 – Inside ATOM: відповідь США на масове зростання моделей у Китаї
22:13 – Зростання «моделей мислення» та масштабування за часом висновку
35:58 – Повний конвеєр Олмо, пояснений просто
46:52 – Попереднє навчання: дані, масштабування та уникнення катастрофічних сплесків
50:27 – Середина тренування (латання хвоста) та уникнення протікання під час тесту
52:06 – Чому важливе навчання в довгому контексті
55:28 – SFT: закладання основи для мислення
1:04:53 – Налаштування преференцій і чому DPO досі працює
1:10:51 – Найскладніше: RLVR, довгі ланцюги мислення та біль у інфраструктурі
1:13:59 – Чому RL такий технічно жорсткий
1:18:17 – Податок складності проти ажіотажу навколо AGI
1:21:58 – Як кожен може зробити внесок у майбутнє ШІ
1:27:26 – Заключні думки