Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ahmad
Исследователь и инженер-программист в области искусственного интеллекта с миссией создания кластера графических процессоров DGX B200
ОПАСНЫЕ ВЕЩИ
> более 20 миллионов разговоров ChatGPT
> теперь являются доказательством... судья только что приказал
> OpenAI передать их в рамках иска
если что-то когда-либо кричало
> Купите GPU
> запустите свой ИИ локально
> защитите свои чертовы данные
это именно здесь


Adam Eisgrau4 дек., 02:12
СРОЧНО: @OpenAI должен передать более 20 миллионов чат-логов истцам, постановил судья Она Ванг в только что изданном 9-страничном приказе:

433,24K
крайне медвежий сигнал
> угощение потенциальных сотрудников
> происходит либо из щедрости
> либо из отчаяния
> в данном случае это последнее
Марк Цукерберг будет запомнен за
> найм Александра Ванга,
> сделав его начальником Янна ЛеКуна &
> разрушение FAIR
достиг пика с Llama3, кажется


Yuchen Jin3 дек., 02:47
Марка Чена из OpenAI:
- "Meta охватила половину моих подчиненных, и все они отказались."
- "У Meta есть 10 миллиардов долларов капитала в год для привлечения талантов."
- "Цукерберг сам готовил и сам доставлял суп людям, которых он пытался нанять из OpenAI."
Безумная война за таланты в области ИИ.
13,56K
> быть arcee
> осмотреться
> понять, что открытые веса MoE на самом деле представляют собой монополию Qwen/DeepSeek
> решить: "нет, мы создаем свои"
> фактическое полное предварительное обучение
> на территории США
> представляем Trinity
> Nano (6B MoE) и Mini (26B MoE)
> открытые веса, Apache 2.0
> бесплатно на OpenRouter пока что
> Nano: модель личности с 800M активных параметров
> Mini: модель рассуждений с 3B активных
> Large: обучение сейчас на 2048 B300s, потому что почему бы и нет
> будущее очевидно
> модели не будут статичными устройствами
> они будут системами, которые растут
> адаптируются
> учатся у ваших пользователей
> переобучаются на основе живого использования
> вы не можете этого сделать, если не владеете весами
> или циклом обучения
> так что arcee переворачивает стол
> решает предварительно обучить все самостоятельно
> шаг 1: AFM-4.5B
> 8T кураторских токенов
> обучено с DatologyAI
> эксперимент "можем ли мы это сделать"
> ответ: да
> также: математика и код все еще болят
> продолжаем в любом случае
> шаг 2: Trinity Nano & Mini
> прыжок прямо в страну MoE
> 56 слоев, 128 экспертов
> сигмоидная маршрутизация, общий эксперт, без вспомогательной потери
> управляемое внимание, QK-норм, сгруппированные запросы
> локальная/глобальная паттернизация
> оптимизатор мюон
> bf16 обучение на 512 H200s
> весь специальный Dion/TorchTitan/HSDP
> длина контекста?
> Nano обучен на 256k (инференс на 128k)
> Mini обучен на 128k
> данные?
> 10T токенов в 3 фазах
> широкий → острый → STEM тяжелый
> Datology выдает синтетический поток
> Prime Intellect поддерживает кластеры H100 в рабочем состоянии
> и да
> обучение MoE в таком масштабе - это боль
> "нет вежливого способа это сказать," боль
> 20T токенов для Trinity Large
> 2048 H100s генерируют синтетические данные
> 2048 B300s обучают фактическую модель
> (отладка - это стиль жизни, кстати)
> но вот где становится весело
> потому что как только вы владеете предварительным обучением
> вы владеете всем, что выше "продукта"
> происхождение данных
> цели
> дрейф поведения
> локальное переобучение
> настоящие долгоживущие системы
> не адская зависимость от API
> так что что дальше?
> Trinity Large
> 420B параметров
> 13B активных на токен
> полностью открыто
> целимся на январь 2026
> момент, когда "Американский MoE" станет вещью™
> Nano + Mini - это разминка
> модели, которые вы можете использовать прямо сейчас
> скачать
> хостить
> дообучать
> ломать
> сообщать об ошибках
> формировать обучение Large
> сообщество разблокировано
> если вам важны открытые веса
> или если вы не хотите передавать весь свой стек черным ящикам
> Trinity - это, по сути, вызов
> заберите Nano + Mini на Hugging Face
> или запустите их на OpenRouter
> стресс-тестируйте их
> находите трещины
> отправляйте отзывы
> вся суть в собственности
мне нравится arcee, они создают эти модели, чтобы вам не приходилось арендовать свой интеллект у кого-то другого

27,57K
Топ
Рейтинг
Избранное

