OpenAI 正在逐步向部分 ChatGPT Plus 用户推出高级语音模式。 该公司今日在 X 平台上公告了此事。 进阶语音模式带来了更自然、实时的对话体验,使用户可以随时打断,并能够感知及响应用户的情感。 参与本次测试的用户将会收到电子邮件和手机应用程序中的通知,告诉他们如何使用此功能。 OpenAI 将会持续招募更多的参与者,并计划在秋季使所有 Plus 用户均可使用此功能。 之前提到的视频和屏幕共享功能将在稍后时候推出。

OpenAI 在五月的活动中首次展示了这个功能,但因为安全问题及 Scarlett Johansson 的投诉而延迟推出,后者声称该语音听起来像她的声音。 该公司表示,已经建立了系统以增强安全性,防止模型使用四个以外的预设声音。 自首次展示进阶语音模式以来,OpenAI 一直在努力提升语音对话的安全性及质量,为将这项尖端技术带给数百万人做好准备。 该公司与100多名外部测试者一同在45种语言中测试了GPT-4o的语音能力。
为了保障用户的隐私,模型仅被训练为使用四个预设声音,并且建立了系统以阻止其他不同的声音输出。 此外,OpenAI还实施了防护措施,防止对暴力或版权内容的请求。 关于GPT-4o的能力、限制及安全评估的详细报告将于八月初公布。
值得一提的是,Apple 已经与 OpenAI 进行合作,将 ChatGPT 整合进 iOS 18、iPadOS 18 和 macOS Sequoia 的用户体验中。