Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
*Основной* выпуск открытого исходного кода AI сегодня. Может ли Америка выиграть гонку Open AI? Мой разговор с @natolambert и @soldni из @allen_ai о запуске Olmo 3
00:00 – Холодное открытие
00:39 – Приветствие и сегодняшнее большое объявление
01:18 – Представление семейства моделей Olmo 3
02:07 – Что такое "базовые модели" на самом деле (и почему они важны)
05:51 – Dolma 3: данные за Olmo 3
08:06 – Производительность против Qwen, Gemma, DeepSeek
10:28 – Что значит истинный открытый исходный код (и почему это редко)
12:51 – Промежуточные контрольные точки, прозрачность и почему AI2 публикует все
16:37 – Почему Qwen повсюду (включая стартапы США)
18:31 – Почему китайские лаборатории переходят на открытый исходный код (и почему лаборатории США этого не делают)
20:28 – Внутри ATOM: ответ США на всплеск моделей Китая
22:13 – Восход "мыслящих моделей" и масштабирование во время вывода
35:58 – Полный процесс Olmo, объясненный просто
46:52 – Предварительное обучение: данные, масштаб и избегание катастрофических всплесков
50:27 – Среднее обучение (ремонт хвоста) и избегание утечки тестов
52:06 – Почему обучение с длинным контекстом имеет значение
55:28 – SFT: создание основы для рассуждений
1:04:53 – Настройка предпочтений и почему DPO все еще работает
1:10:51 – Сложная часть: RLVR, длинные цепочки рассуждений и проблемы с инфраструктурой
1:13:59 – Почему RL так технически жестоко
1:18:17 – Налог на сложность против хайпа AGI
1:21:58 – Как каждый может внести вклад в будущее AI
1:27:26 – Заключительные мысли
... открытая **source** гонка AI, д'ох 🤦♂️
33,57K
Топ
Рейтинг
Избранное

