ChatGPT开启高级语音模式:实时视频通话、屏幕共享和图像上传

先做个广告:如需代注册ChatGPT或充值 GPT4.0会员(plus),请添加站长微信:gpthuiyuan

OpenAI的技术分享日来到第六天,今天终于推出了一次真正的重大更新——ChatGPT开启高级语音模式:实时视频通话、屏幕共享和图像上传。

推荐使用GPT中文版,国内可直接访问:https://ai.gpt86.top 

这次更新无疑是对人工智能技术的重大突破,它将ChatGPT的能力推向了一个全新的高度。

话不多说,一起来看看有这些功能有亮眼的地方吧!

为什么这次更新如此重要?

OpenAI首席执行官Sam Altman在接受Salesforce采访时提到,他最钟爱的AI题材电影是《她》(《Her》),这部讲述一名男子爱上AI虚拟助手的电影令他深感触动。

他表示:“对话语言界面的概念具有惊人的前瞻性。” 据《The Information》报道,Altman的愿景是最终打造出一种能够快速响应的虚拟助手,就像电影中的AI助理一样,成为人类生活中贴心而高效的伴侣。

在此次技术直播中,OpenAI的首席扩展官Kevin Weil和多模态技术负责人Michelle Qin等人,在直播中详细介绍了这一系列新功能。

这些更新标志着人工智能朝着更具情感反馈和人性化的方向迈出了重要一步,特别是实时视频通话功能,它让AI与人类之间的互动更为自然、流畅。

正如电影《Her》中的AI助手一样,ChatGPT不再是一个仅通过文字交流的工具,它现在能通过声音、图像甚至情感反馈与用户进行更加全面的互动。这不仅仅是语言处理的进步,更是向具身智能迈出的一大步。

网友直呼“《Her》正在逐渐成为现实”。

重要进步之一:实时视频通话

此次更新中,最引人注目的功能是实时视频通话,ChatGPT不仅能够通过文本和语音进行交流,还可以通过视频与用户进行实时互动。

与现实世界无缝连接

通过摄像头,ChatGPT能够实时“看到”用户所在的环境,并根据实际情况提供帮助。

在OpenAI的团队成员依次与ChatGPT视频打过招呼并有了一定的认识后,有人发问:带着驯鹿角的同事叫什么?ChatGPT用圣诞老人限定语音给出了准确答案,展现“记忆”能力。

情感反馈的增强

AI现在能够识别和回应用户的情绪。例如,在交流中,ChatGPT不仅可以模仿语气和情感,还能够根据上下文调整语调,使互动更贴近真实的对话。

视觉能力的解锁

这意味着AI能够识别和理解用户周围的环境,像人类一样通过视觉获取信息。无论是识别物体、分析图像,还是理解场景,ChatGPT的视觉能力让它更具备“眼而语”的能力。

在直播中,OpenAI团队演示了ChatGPT如何教人操作手冲咖啡设备,只需给ChatGPT打一通“视频通话”,它能根据你面前的器具,手把手教你完成每一个步骤。在整个演示过程中,ChatGPT的声音自然而亲切,还调整了语气,甚至像人类一样大笑。

通过这些功能,ChatGPT的交互方式变得更加直观和自然,用户不再仅依赖文字或语音,而是能够通过“看”和“说”来进行沟通,提升了互动的沉浸感和效率。

实时屏幕共享与高级语音模式

除了实时视频通话外,OpenAI还推出了实时屏幕共享功能。用户可以将自己的屏幕共享给ChatGPT,后者能够实时查看并提供针对性的建议。

例如:

  • 在工作中,如果你遇到PPT设计、代码编写或数据分析的难题,只需将屏幕共享给ChatGPT,它就能通过视觉帮助你优化设计或发现潜在的错误。

  • 在进行创意设计时,ChatGPT能够识别屏幕上的内容并为你提供建议,帮助你做出更好的决策。

直播中,OpenAI团队成员与其共享成功后,让ChatGPT浏览了自己的短信并要求指导回复,ChatGPT展现了“高情商”的一面,建议夸赞对方的圣诞装饰。


高级语音(Advanced Voice)模式也进一步增强了互动体验,支持超过50种语言,提供9种自然语音选项,每种语音都具备独特语气和特征。

甚至在Advanced Voice这一高级语音模式中,新增了“限时”的圣诞老人声音作为“节日特供”,有效期持续到明年1月初,在全球范围内,所有移动、网络和桌面App用户都可选用,它可通过 ChatGPT 中的雪花图标访问。

其背后的GPT-4o不仅能够将语音转为文本,还能识别和分析音频中的呼吸、情绪等细节

最后有话说

这次的新功能给人一种AI越来越“贴心”的感觉。不仅能听会说,还能看、能理解,真的像是电影《Her》里的AI助手逐步走进了现实。想象一下,它能帮你设计PPT、调试代码、甚至在做咖啡时陪你聊天,这种体验多像有个聪明又暖心的朋友随时待命啊!

未来,随着这些技术继续发展,我觉得人工智能在教育、健康、创意设计等领域肯定会有更多惊喜。

不过这也不免会涉及到其他方面的问题,实时视频通话,实时屏幕共享与高级语音选项是否可以保证用户的隐私安全,以及AI的伦理知识是否正确,是否存在越权等可能,这都会是OpenAI之后将会考虑的点!!!

chatgpt plus(GPT4)代充值

本文链接:https://lechangxia.cc/gpt4/2132.html

chatgpt开通会员有啥优势chatgpt提问响应失败chatgpt引爆搜索引擎大战chatgpt4.0手机端怎么使用chat gpt充值靠谱吗chatgpt 国内注册教程chatgpt不注册可以使用吗chatgpt4的商业化方案gpt plus充值教程必应chatgpt4.0怎么用

相关文章