Cartesia on juuri julkaissut Sonic-3:n, uuden lippulaivansa tekstistä puheeksi -mallin reaaliaikaiseen keskusteluun Sonic-3 tarjoaa tekstistä puheeksi -suoratoiston sisäänrakennetuilla prosodisilla elementeillä, kuten naurulla, sekä tunteilla, kuten yllätyksellä ja uteliaisuudella. Uusi malli tukee 42 kieltä, mukaan lukien 9 intialaista kieltä. Sonic-3 hyödyntää State Space Model (SSM) -arkkitehtuuria, kuten Cartesian aiemmat julkaisut. Cartesia on ollut johtava SSM:ien käytössä, ja muut mallit käyttävät tyypillisesti muuntajapohjaisia arkkitehtuureja. SSM:t ovat yleensä laskenta- ja muistitehokkaampia, mikä todennäköisesti vaikuttaa Sonic-3:n suhteellisen vaikuttavaan latenssiin. Cartesia tarjoaa tilaus- ja krediittihinnoittelumallin, joka vaihtelee 0 dollarista kuukaudessa henkilökohtaiseen käyttöön ja 299 dollariin kuukaudessa Scale-paketistaan. Sonic-3 on lisätty keinotekoisen analyysin tekstistä puheeksi -areenalle sokeaa preferenssiäänestystä varten. Kuuntele esimerkkileikkeitä alta 🎧