Актуальні теми
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.

Artificial Analysis
Незалежний аналіз моделей штучного інтелекту та хостинг-провайдерів - виберіть найкращу модель та API провайдера для вашого випадку використання
Alibaba випустила Qwen3 Next 80B: гібридну модель міркування з відкритими вагами, яка досягає інтелекту рівня DeepSeek V3.1 з активними параметрами лише 3B
Ключові моменти:
💡 Нова архітектура: Перша модель, яка представила базові моделі @Alibaba_Qwen Qwen3-Next, з декількома ключовими архітектурними рішеннями, такими як гібридний механізм уваги Gated DeltaNet і Gated Attention, і високою розрідженістю з часткою активних параметрів 3,8%, в порівнянні з 9,4% для Qwen3 235B
🧠 Інтелект: Qwen3 Next 80B (Міркування) має 54 бали за Індексом інтелекту штучного аналізу, розміщеним поряд із DeepSeek V3.1 (Міркування). Варіант без обґрунтування набрав 45 балів, відповідно до gpt-oss-20B і Llama Nemotron Super 49B v1.5 (Reasoning)
💲 Модель ціноутворення: Ціна за токен на @alibaba_cloud становить $0,5/$6 за 1 млн вхідних/вихідних токенів для міркувань і $0,5/$2 для варіанту без обґрунтування. Це можна порівняти з вищими цінами на Qwen3 235B 2507 $0,7/$8,4 з міркувань і $0,7/$2,8 без - зниження на ≥25% залежно від завантаженості
⚙️ Деталі моделі: Модель має власне контекстне вікно з 256 тисячами токенів і є лише текстовою, без мультимодальних входів або виходів. При параметрах всього 80B при FP8 модель вміщується на одному графічному процесорі H200

87
Запускаємо наше дослідження State of Generative Media 2025 за підтримки @fal! Візьміть участь, щоб отримати повний звіт про опитування та виграти пару Meta Ray-Ban 🕶️
Ми проводимо опитування, щоб зібрати інформацію про стан генеративних медіа у 2025 році. Це включає погляди на те, як організації використовують, вибирають і отримують доступ до моделей зображень, відео та музики!
Чому варто брати участь?
✅ Отримайте безкоштовну копію розширеного звіту про опитування (у відкритому доступі буде лише обмежена версія)
✅ Шанс виграти пару окулярів Ray-Ban Meta AI Glasses 🕶️
✅ Долучайтеся до обміну думками про ключові тенденції, що формують генеративні медіа
Посилання в гілці нижче! ⬇️⬇️⬇️⬇️⬇️⬇️⬇️
148
DeepSeek запускає версію 3.1, об'єднуючи V3 і R1 у гібридну модель міркувань з поступовим зростанням інтелекту
Поступове збільшення інтелекту: Початкові результати порівняльного аналізу для DeepSeek V3.1 показують, що індекс інтелекту штучного аналізу становить 60 балів у режимі міркувань, порівняно з результатом R1 у 59 балів. У режимі без міркувань V3.1 досягає 49 балів, що є більшим збільшенням порівняно з попереднім результатом V3 0324 у 44 балах. Це залишає V3.1 (міркування) позаду останнього Qwen3 235B 2507 від Alibaba (міркування) - DeepSeek не повернув собі лідерство.
Гібридне міркування: @deepseek_ai вперше перейшов до гібридної моделі міркування, підтримуючи як режими міркування, так і способи неміркування. Перехід DeepSeek до єдиної гібридної моделі міркувань імітує підхід, прийнятий OpenAI, Anthropic і Google. Цікаво, однак, відзначити, що Alibaba нещодавно відмовилася від свого гібридного підходу, якому вони віддали перевагу для Qwen3, випустивши окремі випуски моделей міркувань та інструкцій Qwen3 2507.
Виклик функцій / використання інструменту: У той час як DeepSeek заявляє про покращений виклик функцій для моделі, DeepSeek V3.1 не підтримує виклик функцій у режимі міркування. Це, ймовірно, суттєво обмежить його здатність підтримувати агентські робочі процеси з вимогами до інтелекту, у тому числі в агентах кодування.
Використання токенів: DeepSeek V3.1 отримує поступово вищі бали в режимі міркувань, ніж DeepSeek R1, і використовує трохи менше токенів у всіх показниках, які ми використовуємо для індексу інтелекту штучного аналізу. У режимі без міркувань він використовує трохи більше токенів, ніж V3 0324 - але все одно в кілька разів менше, ніж у власному режимі міркування.
API: Перший сторонній API DeepSeek тепер обслуговує нову модель DeepSeek V3.1 як на їхніх кінцевих точках чату, так і на кінцевих точках міркувань - просто змінюючи, чи надається токен кінцевого мислення </think> моделі в шаблоні чату, щоб контролювати, чи буде модель міркувати.
Архітектура: DeepSeek V3.1 архітектурно ідентична попереднім моделям V3 і R1, із загальними параметрами 671B і 37B активними параметрами.
Наслідки: Ми б радили з обережністю робити будь-які припущення про те, що цей реліз означає про прогрес DeepSeek у напрямку майбутньої моделі, яку в чутках називають V4 або R2. Зазначимо, що раніше DeepSeek випустила фінальну модель, побудовану на їхній архітектурі V2, 10 грудня 2024 року, всього за два тижні до релізу V3.


436
Найкращі
Рейтинг
Вибране