*Основной* выпуск открытого исходного кода AI сегодня. Может ли Америка выиграть гонку Open AI? Мой разговор с @natolambert и @soldni из @allen_ai о запуске Olmo 3 00:00 – Холодное открытие 00:39 – Приветствие и сегодняшнее большое объявление 01:18 – Представление семейства моделей Olmo 3 02:07 – Что такое "базовые модели" на самом деле (и почему они важны) 05:51 – Dolma 3: данные за Olmo 3 08:06 – Производительность против Qwen, Gemma, DeepSeek 10:28 – Что значит истинный открытый исходный код (и почему это редко) 12:51 – Промежуточные контрольные точки, прозрачность и почему AI2 публикует все 16:37 – Почему Qwen повсюду (включая стартапы США) 18:31 – Почему китайские лаборатории переходят на открытый исходный код (и почему лаборатории США этого не делают) 20:28 – Внутри ATOM: ответ США на всплеск моделей Китая 22:13 – Восход "мыслящих моделей" и масштабирование во время вывода 35:58 – Полный процесс Olmo, объясненный просто 46:52 – Предварительное обучение: данные, масштаб и избегание катастрофических всплесков 50:27 – Среднее обучение (ремонт хвоста) и избегание утечки тестов 52:06 – Почему обучение с длинным контекстом имеет значение 55:28 – SFT: создание основы для рассуждений 1:04:53 – Настройка предпочтений и почему DPO все еще работает 1:10:51 – Сложная часть: RLVR, длинные цепочки рассуждений и проблемы с инфраструктурой 1:13:59 – Почему RL так технически жестоко 1:18:17 – Налог на сложность против хайпа AGI 1:21:58 – Как каждый может внести вклад в будущее AI 1:27:26 – Заключительные мысли
... открытая **source** гонка AI, д'ох 🤦‍♂️
33,57K