鞭牛士报道,10月2日消息,据外电报道,OpenAI 正在向@R_502_5729@人员开放其语音AI引擎,该引擎为 chatgpt 的高级语音模式提供支持。
开发人员将能够实时访问这项技术,AI 可以理解语音命令,并在类似通话的现场场景中进行语音交谈。
该过程之前要求开发人员至少经历三个步骤:首先转录音频,然后运行生成的文本模型来得出查询的答案,最后使用单独的文本转语音模型。
此举为提供对话式语音界面的人工智能应用浪潮铺平了道路。
新的语音转语音功能是 OpenAI 在周二旧金山举行的 DevDay 活动上发布的几个公告之一。
该功能的早期测试者包括营养和健身应用程序 Healthify 和语言学习应用程序 Speak。
在为记者进行的演示中,OpenAI 高管展示了新的音频功能与 Twilio 的 API 相结合的示例,该功能允许 AI 助手致电虚构的糖果店并订购 400 个巧克力草莓。
在工具的定制演示中,有一个例子是与人工智能系统对话,帮助寻找本地产品,比如草莓。然后,人工智能会打电话给商家订购草莓,并接受用户关于订购数量和期望花费的指示。
OpenAI 表示,任何使用此类技术的人都不得隐瞒它是人工智能而非人类,而且只向开发人员提供六种预设,而不是创建新的声音。
开发人员只能使用 OpenAI 提供的声音——与 chatgpt 中的选项相同。
虽然声音不会以任何方式被加水印,开发人员也不必让人工智能系统识别自己,但 OpenAI 表示,使用其系统发送垃圾邮件或误导人们违反了公司的服务条款。
这些公告是在围绕 chatgpt 制造商的一系列新闻中发布的,包括其正在进行的大规模融资活动以及上周首席技术官 Mira Murati和另外两名高管的离职。
版权声明:本文内容由互联网用户自发贡献,该文观点与技术仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 [email protected] 举报,一经查实,本站将立刻删除。