智东西
编译 程茜
编辑 李水青
智东西8月29日消息,今天凌晨,OpenAI发布为开发人员打造的语音转语音模型GPT-RealTime,并同步更新了包括远程MCP服务器支持、图像输入和SIP(通过会话发起协议)电话呼叫支持的API功能。
OpenAI称这是其迄今为止最先进的语音合成模型,GPT-RealTime在遵循复杂指令、精确调用工具以及生成更自然、更具表现力的语音方面有所改进。该模型可以自然朗读重复的字母、数字,无缝切换语言,甚至可以捕捉笑声等非语言信号。
今天OpenAI还发布了两个新语音Cedar和Marin,它们将在Realtime API中独家提供。
定价方面,通用版Realtim