Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

samsja
Ведущие научные исследования в @PrimeIntellect
Следующее поколение стартапов с оценкой более 10 миллиардов долларов будет построено на масштабировании обучения в собственном RL-окружении.
Мы живем в изобилии возможностей, и все же у нас есть только два основных продукта ИИ: chatgpt и кодирующий агент, и это меня глубоко расстраивает.
Текущая цепочка поставок искусственного интеллекта структурно сломана: один поставщик оборудования, пара гигантских игроков ИИ владеют всей переработкой интеллекта, разработчики остаются с доступом к API и почти без контроля.
Как будто эра интернета была построена с Intel, продающим процессоры четырем гигантам облачных технологий, владеющим всей инфраструктурой и программным стеком с секретами и NDA повсюду, и предоставляющим WordPress в качестве набора для разработки стартапам.
Почему Perplexity не изобрел глубокие исследования? Они просто не могли, потому что это обучается с помощью RL.
Мой прогноз на следующие годы:
RL станет самым мощным инструментом для стартапов, создающих продукты ИИ. Мы увидим сотни успешных историй, таких как Cursor и Lovable. Конечные пользователи получат от этого наибольшую выгоду.
Большие лаборатории будут эволюционировать в продуктовые компании, OAI сосредоточится на потребительском рынке, Antropic на кодирующем агенте, DeepMind интегрирует ИИ во все бизнесы Google, Meta и XAI будут бороться за социальные медиа.
Мы увидим появление экосистемы стартапов в области ИИ-инфраструктуры, продающих вычисления, обучающих базовые модели, курирующих данные, создающих RL-окружения, предлагающих дешевую инференцию и обучение, поддерживаемую открытой наукой и программным обеспечением с открытым исходным кодом.
@PrimeIntellect является пионером этой экосистемы, и видение открытого исходного кода AGI, хаба RL-окружений — это один из первых ключевых элементов.

Prime Intellect14 часов назад
Представляем Хаб Окружений
Окружения RL являются ключевым узким местом для следующей волны прогресса в области ИИ, но крупные лаборатории их закрывают
Мы создали платформу сообщества для краудсорсинга открытых окружений, чтобы любой мог внести свой вклад в открытый AGI
3,23K
samsja сделал репост
14 дней распределенного обучения, день 7!
Познакомьтесь с Сами Джагоуаром (@samsja19) из @PrimeIntellect:
Сами возглавляет их исследования и сосредоточен на децентрализованном предварительном обучении и распределенном обучении с подкреплением в рамках своей работы.
Сами проведет лекцию о том, как выглядит внедрение децентрализованного обучения в Prime.

7,92K
Последний хакатон в режиме GPU был лучшим хакатоном, на котором я когда-либо присутствовал лично, с нетерпением жду следующего.

Mark Saroufim23 авг., 05:09
Снова пришло время для нашего последнего (теперь ежегодного) праздника в этом году. GPU MODE снова встречается в реальной жизни в центре Сан-Франциско в пятницу, 24 октября, с 10:00 до 22:00, чтобы хакать весь день.

3,66K
Похоже, что другие люди начинают использовать vllm v1 logprob для соотношения важности, чтобы исправить проблему стабильности.
Я думаю, у меня посттравматическое стрессовое расстройство от такого рода краха RL.

Zichen Liu22 авг., 23:35
Всего лишь с несколькими строками кода предложенное решение Фэна (@fengyao1909) — применение важностного отбора к политике поведения — решило проблему нестабильности обучения в моем случае (oat). Я верю, что этот результат может быть обобщен и для других RL-фреймворков. Отличная работа, Фэн!

6,79K
Я нанимаю инженера-исследователя в @PrimeIntellect
Мы создаем лаборатории открытого исходного кода AGI и ищем талантливых специалистов. Нам не важен ваш предыдущий должностной титул.
Все в исследовательской команде являются full stack, мы строим инфраструктуру и также работаем с данными. Если у вас есть особый интерес к системам, обучению с подкреплением, данным или законам масштабирования, вам будет предложено множество задач для решения.
83,28K
Топ
Рейтинг
Избранное