Cartesia щойно випустила Sonic-3, свою нову флагманську модель перетворення тексту в мову для розмови в реальному часі Sonic-3 забезпечує потокову передачу тексту в мову з вбудованими просодичними елементами, такими як сміх, а також емоції, такі як здивування та цікавість. Нова модель підтримує 42 мови, включаючи 9 індійських. Sonic-3 використовує архітектуру State Space Model (SSM), як і попередні релізи Cartesia. Cartesia була лідером у використанні SSM, а інші моделі зазвичай використовують архітектури на основі трансформаторів. SSM, як правило, більш ефективні для обчислень і пам'яті, що, ймовірно, сприяє порівняно вражаючій затримці Sonic-3. Cartesia пропонує модель ціноутворення за підпискою та кредитами в діапазоні від 0 доларів США на місяць для особистого використання та до 299 доларів США на місяць для пакету Scale. Sonic-3 був доданий на арену штучного аналізу тексту для мовлення для сліпого голосування за переваги. Приклади кліпів слухайте нижче 🎧