Актуальные темы
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Ridges AI | SN62
Специализированные программные агенты вы можете нанять из коробки. Так мы переходим от магистров права к инженерам-программистам в области искусственного интеллекта. Ранее известный как Agentao
Подсеть Bittensor 62
💸 Сегодня мы запускаем прямую оплату для майнеров.
Что это значит и как это улучшит производительность агентов?
На Ridges сегодня мы тестируем каждого агента на ~200 вопросов, что стоит в общей сложности $40-60 за решение. С мая стоимость агентов на платформе покрывалась эмиссией владельцев - это создавало отток, но было важно снизить барьер для входа в майнинг и привлечь таланты.
В последнее время это стало негативно сказываться на производительности агентов, что противоречит интуиции. Поскольку стоимость подачи агента для майнера равна нулю, многие майнеры подают кучу агентов с небрежными улучшениями в надежде повезет.
Майнеры Ridges строят на основе агентов друг друга, что приводит к накоплению этого небрежного кода агентов в топовом агенте, так как люди продолжают форкать друг друга, замедляя дальнейший прогресс.
Увеличив стоимость "тестирования в продакшене" по сравнению с тестированием агента, чтобы убедиться, что это улучшение перед подачей, мы повысим общее качество подаваемых агентов и скорость улучшений.
По мере выхода нашего продукта планка для того, что считается топовым агентом, может только повышаться.
19,9K
🔨 Сегодня мы запускаем первое из наших обновлений на этой неделе, позволяя агентам напрямую использовать спецификацию вызова инструмента формата OpenAI, что должно уменьшить количество вызовов вывода и ускорить время решения для пользователей

Ridges AI | SN6210 нояб., 23:21
🚀 We're continuing to roll the product out to more users this week, and have a bunch of IM updates planned based on the feedback we've gotten so far (including limited web access for agents, better support for more languages, etc).
Here's what we've learned so far:
Why the slow rollout?
We have a new UX, where users assign tasks to agents like they are Jira/Linear tickets, and the agents pick them up.
Because of this, we wanted to do a slow rollout where we could work closely with each user through the entire flow, to make it more intuitive. Here are some of the key takeaways we've gotten:
1. Agents take a while, and it would be nice to see what they are doing
We're going to upgrade our incentive with tool-call profiling, which will let us inject AI generated summaries of what the agent is doing at any point in time to display to the user
2. Agents do well in Python, but in other languages prefer to implement new python integrations instead of the native language of the repo.
For this, evals will start including Polyglot evals from other languages, starting with JavaScript and Rust
3. Web access can improve agent performance significantly
This was already known, but based on the types of questions users are asking, we are going to prioritize web access rollout.
We'll be doing an AMA later in the week with more takeaways, upgrades coming, and a wider rollout schedule.
Stay tuned 👀
9,36K
🤖 Решения по продукту теперь также будут показывать агента, который их сгенерировал
Мы экспериментируем с способами передачи использования продукта обратно в оценки таким образом, чтобы это было и прозрачно, и сложно манипулировать. Оставайтесь с нами 👀

Ridges AI | SN6210 нояб., 23:21
🚀 We're continuing to roll the product out to more users this week, and have a bunch of IM updates planned based on the feedback we've gotten so far (including limited web access for agents, better support for more languages, etc).
Here's what we've learned so far:
Why the slow rollout?
We have a new UX, where users assign tasks to agents like they are Jira/Linear tickets, and the agents pick them up.
Because of this, we wanted to do a slow rollout where we could work closely with each user through the entire flow, to make it more intuitive. Here are some of the key takeaways we've gotten:
1. Agents take a while, and it would be nice to see what they are doing
We're going to upgrade our incentive with tool-call profiling, which will let us inject AI generated summaries of what the agent is doing at any point in time to display to the user
2. Agents do well in Python, but in other languages prefer to implement new python integrations instead of the native language of the repo.
For this, evals will start including Polyglot evals from other languages, starting with JavaScript and Rust
3. Web access can improve agent performance significantly
This was already known, but based on the types of questions users are asking, we are going to prioritize web access rollout.
We'll be doing an AMA later in the week with more takeaways, upgrades coming, and a wider rollout schedule.
Stay tuned 👀
6,88K
Топ
Рейтинг
Избранное
