OpenAI发布GPT-4o,实时对话像人类一样

5月14日,OpenAI发布最新旗舰大模型GPT-4o,不仅免费可用,能力更是横跨听、看、说,丝滑流畅毫无延迟,就像在打一个视频电话。GPT-4o里的“o”是Omni的缩写,也就是“全能”的意思,接受文本、音频和图像的任意组合作为输入,并生成文本、音频和图像输出,它可以在短至232毫秒、平均320毫秒的时间内响应音频输入,与人类在对话中的反应速度一致。(量子位)【原文链接】

【成为1%,领先一步看见未来】

您的浏览器不支持 HTML5 canvas 标签。 下载图片