在代理平台中引入由 ElevenLabs 托管的 LLM。 由 ElevenLabs 托管的 LLM 提供超低延迟和降低推理成本的语音代理,推动对话代理性能的前沿发展。
通过 GLM 4.5 Air,ElevenLabs 代理以大约三分之一的成本实现顶级推理准确性和工具调用性能。
Qwen3-30b-a3b 实现了低于 150 毫秒的首句响应时间,使 ElevenLabs 代理能够在较轻的推理任务中进行流畅、自然的对话。
ElevenLabs 托管的 LLM 是开源模型,与我们的专有语音转文本、文本转语音和轮流对话模型在统一环境中运行 - 降低延迟,提高可靠性,增强数据安全性。
23.31K