أصدرت Cartesia للتو Sonic-3 ، نموذجها الرائد الجديد من تحويل النص إلى كلام للمحادثة في الوقت الفعلي يوفر Sonic-3 دفقا من النص إلى كلام مع عناصر عروضية مدمجة مثل الضحك ، بالإضافة إلى مشاعر مثل المفاجأة والفضول. يدعم النموذج الجديد 42 لغة ، بما في ذلك 9 لغات هندية. تستفيد Sonic-3 من بنية نموذج فضاء الدولة (SSM) مثل إصدارات Cartesia السابقة. كانت Cartesia رائدة في استخدام SSMs ، مع نماذج أخرى تستخدم عادة البنى القائمة على المحولات. تعد SSMs بشكل عام أكثر كفاءة في الحوسبة والذاكرة ، مما يساهم على الأرجح في زمن انتقال Sonic-3 المثير للإعجاب نسبيا. تقدم Cartesia نموذج تسعير اشتراك وائتمانات يتراوح من 0 دولار شهريا للاستخدام الشخصي ، وحتى 299 دولارا شهريا لحزمة Scale الخاصة بهم. تمت إضافة Sonic-3 إلى ساحة التحليل الاصطناعي من النص إلى الكلام للتصويت التفضيلي الأعمى. استمع إلى عينات المقاطع أدناه 🎧