OpenAI放大招!GPT-4o震撼发布，速度更快、价格更亲民还能检测人的情绪

2024-05-15
小编: 网络
正體

分享到：

导读: 再也不用在网页间互相切换了，新的桌面版可以融入任何工作流，随时和用户用图像文字语音进行交流，虽然还没用上，但可以想像这种工作体验有多快乐,第二件事情就是宣布，的免费

齐齐哈尔时尚网小编提示，记得把"OpenAI放大招!GPT-4o震撼发布，速度更快、价格更亲民还能检测人的情绪"分享给大家！

北京时间周二（5月14日）凌晨，美国人工智能研究公司OpenAI在线上举办了“春季更新”活动。

简要来说，OpenAI的发布会主要干了两件事情：发布最新GPT-4o多模态大模型，相较于GPT-4 Trubo速度更快、价格也更便宜。

第二件事情就是宣布，ChatGPT的免费用户也能用上最新发布的GPT-4o模型（更新前只能使用GPT-3.5），来进行数据分析、图像分析、互联网搜索、访问应用商店等操作。这也意味着GPT应用商店的开发者，将面对海量的新增用户。

当然，付费用户将会获得更高的消息限制（OpenAI说至少是5倍）。当免费用户用完消息数量后，ChatGPT将自动切换到GPT-3.5。

另外，OpenAI将在未来1个月左右向Plus用户推出基于GPT-4o改进的语音体验，目前GPT-4o的API并不包含语音功能。苹果电脑用户将迎来一款为macOS设计的ChatGPT桌面应用，用户可以通过快捷键“拍摄”桌面并向ChatGP提问，OpenAI表示，Windows版本将在今年晚些时候推出。

值得一提的是，公司首席技术官米拉·穆拉蒂在一次直播活动中表示:“这是我们第一次在易用性方面真正向前迈出了一大步。”

图片来源：视频截图

OpenAI由微软支持，目前投资者对其估值已超过800亿美元。该公司成立于2015年，目前正面临在生成式AI市场保持领先地位的压力，同时需要想方设法实现盈利，因为其在处理器和基础设施建设上投入了大量资金，以构建和训练其模型。

“O”是包罗万象的O

发布会刚开始，米拉·穆拉蒂为这次新发布定了调，说OpenAI的目标是进一步减小人们使用AI的障碍，让所有人都能在工作、学习、创造中用上AI工具。

为了这个目的，OpenAI做了三件事：发布更强大的模型GPT-4o，更新用户界面提高使用体验，然后一口气免费开放给用户。穆拉蒂补充道，付费用户享有五倍的使用容量限制。

据OpenAI表示，GPT-4o是一个“原生多模态”模型，它的命名来源于“omni”，即包罗万象之意。

比起此前要么是图文模式要么是语音模式的GPT-4，它更擅长打组合拳，可以接受文字、音频、图像的任意组合输入，然后无缝衔接图文音频的多种形式输出。

升级后的GPT-4o回答速度更快了。

据OpenAI表示，GPT-4想要实现和人的对话需要通过三步来实现：先把语音转换为文字，再生成回复文本，最后再转成语音。根据用户选择模型的不同，这个过程的平均延迟高达2.8秒（GPT-3.5）和5.4 秒（GPT-4），对着手机屏幕等回复，跟GPT聊过天的朋友应该都有类似的体验。而且在语音转文字再转语音的过程中，很多信息损失了，GPT无法获得说话人的音调，也无法收取背景音，如果有多个人一起说话更是灾难性的场景。

“我们跨文本、视觉和音频端到端地训练了一个新模型，”OpenAI写道，“这意味着所有输入和输出都由同一神经网络处理。”现在的GPT-4o可以在最短232毫秒内响应对话，平均响应时间320毫秒，和人类的反应速度几乎一样，爱跟ChatGPT聊天的朋友终于可以从微信语音模式切换到日常交流模式了。

GPT-4o还带来了更好用的界面。

再也不用在网页间互相切换了，新的桌面版GPT可以融入任何工作流，随时和用户用图像文字语音进行交流，虽然还没用上，但可以想像这种工作体验有多快乐。