ChatGPT发布三款语音模型,详细介绍

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gptchongzhi

OpenAI发布三款语音模型

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

语音转文本模型GPT-4o-Transcribe

和GPT-4o-Mini-Transcribe

文本转语音模型GPT-4o-MiniTTS

图源:OpenAI

据了解,语音转文本模型

准确率大幅提升

在英语、西班牙语中

单词错误率仅约2%

在普通话中的错误率约为7%

此外,文本转语音模型

能提供更逼真的语音

开发人员可指导它

用自然语言说话

AI模型能get到人说了什么

新推出的两款语音转文本模型
相较于OpenAI此前发布的Whisper
准确度明显更高
并在多种语言中实现了
更低的单词错误率

新模型在多种语言中的错误率都明显更低。
图源:OpenAI
OpenAI产品人员介绍
新模型支持超100种语言
利用了多样化、高质量音频数据集
进行训练
即使在嘈杂的环境中
也可以更好地捕捉
口音和不同语速的语音
 
至于大家关注的AI幻觉问题
OpenAI还是以Whisper为参照物
表示新模型在工作中
产生幻觉的概率降低了
产品人员表示
“准确性
意味着模型准确地听到了单词
(并且)没有填写他们没有听到的细节”

AI模型说话有了更多“语气”

此次新发布的文本转语音模型

不仅能提供听起来更逼真的语音

而且比前一代语音合成模型

“可操控性”更强

例如

开发人员可以发出

“模拟耐心客服”或

“进行生动故事叙述”等指令

控制语音风格


OpenAI产品人员表示

他们的目标是

让开发者能够定制

语音“体验”和“环境”

以便在不同的情况下

使声音表达出不同的情感

更好地应用于

客服和创意内容等方面

距离AI“真情流露”更进一步

今年AI的风向也在悄然变化

除了依旧强调智商

还多出一股趋势

——强调情感

chatgpt plus(GPT4)代充值

本文链接:https://lechangxia.cc/gpt4/2644.html

chatgpt4镜像购买ChatGPT账号chatgpt注册登录chatgpt注册知乎chatgpt提问模板大全

相关文章