先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi
OpenAI发布三款语音模型
推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top
语音转文本模型GPT-4o-Transcribe
和GPT-4o-Mini-Transcribe
文本转语音模型GPT-4o-MiniTTS
图源:OpenAI
据了解,语音转文本模型
准确率大幅提升
在英语、西班牙语中
单词错误率仅约2%
在普通话中的错误率约为7%
此外,文本转语音模型
能提供更逼真的语音
开发人员可指导它
用自然语言说话
AI模型能get到人说了什么
AI模型说话有了更多“语气”
此次新发布的文本转语音模型
不仅能提供听起来更逼真的语音
而且比前一代语音合成模型
“可操控性”更强
例如
开发人员可以发出
“模拟耐心客服”或
“进行生动故事叙述”等指令
控制语音风格
OpenAI产品人员表示
他们的目标是
让开发者能够定制
语音“体验”和“环境”
以便在不同的情况下
使声音表达出不同的情感
更好地应用于
客服和创意内容等方面
距离AI“真情流露”更进一步
今年AI的风向也在悄然变化
除了依旧强调智商
还多出一股趋势
——强调情感