Chủ đề thịnh hành
#
Bonk Eco continues to show strength amid $USELESS rally
#
Pump.fun to raise $1B token sale, traders speculating on airdrop
#
Boop.Fun leading the way with a new launchpad on Solana.
Cartesia vừa phát hành Sonic-3, mô hình Text to Speech hàng đầu mới của họ cho cuộc trò chuyện thời gian thực
Sonic-3 cung cấp dịch vụ Text to Speech streaming với các yếu tố ngữ điệu tích hợp như tiếng cười, cũng như các cảm xúc như sự ngạc nhiên và sự tò mò. Mô hình mới hỗ trợ 42 ngôn ngữ, bao gồm 9 ngôn ngữ Ấn Độ.
Sonic-3 tận dụng kiến trúc Mô hình Không gian Trạng thái (SSM) giống như các phiên bản trước của Cartesia. Cartesia đã dẫn đầu trong việc sử dụng SSM, trong khi các mô hình khác thường sử dụng kiến trúc dựa trên transformer. SSM thường hiệu quả hơn về tính toán và bộ nhớ, điều này có thể góp phần vào độ trễ ấn tượng tương đối của Sonic-3.
Cartesia cung cấp mô hình định giá theo đăng ký và tín dụng dao động từ $0 mỗi tháng cho việc sử dụng cá nhân, lên đến $299 mỗi tháng cho gói Scale của họ.
Sonic-3 đã được thêm vào Arena Text to Speech Phân tích Nhân tạo để bỏ phiếu theo sở thích của người khiếm thị.
Nghe các đoạn mẫu bên dưới 🎧
Hàng đầu
Thứ hạng
Yêu thích

