GPT-5发布了,到底有没有那么神?

客服微996438433个月前财经知识68

GPT-5,终于在深夜出炉。

以为很震惊,以为很惊艳?确实有。

但先来看一张图:

_GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?

OpenAI到底是如何做到在全球直播的场合展示Benchmark,竟然能把52.8显示得比69.1都高,甚至这个69.1能跟30.8平齐的???

其它的不谈,单就这一点,开场直接号称“博士水平”的AI,就这么水灵灵地“按需缩放”坐标系,也是引得网友怒喷不已。

GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?_

甚至Altman都赶忙出来转移话题,称技术博客上是正确的……

_GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?

确实,技术博客确实是有所更正。

GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?_

但如此失误,着实不应该,毕竟大家都等了2年啊!

博士水平的AI,来了

不过有一说一,除了这个被大众诟病的致命失误之外,GPT-5在现场的表现还算是可圈可点。

在技术博客中,OpenAI开场直接一句:“迄今为止,这是我们最智能、最快速、最实用的模型,内置的思考能力让每个人都能拥有专家级智能。”

这次发布的GPT-5拥有四个版本:

GPT-5目前已面向普通用户提供免费、plus和Pro三种模式。

同时在API平台上,推出了GPT-5、GPT-5 nano、GPT-5 mini三种模型选择。

不仅如此,承接昨天时隔6年的开源,OpenAI表示这次GPT-5面向所有人,免费!并且是博士水平的那种。

我们先来看下Benchmark。

最让人吸睛的,还是GPT-5在AIME 2025的表现,直接拿下满分的成绩。

GPT-5发布了,到底有没有那么神?__GPT-5发布了,到底有没有那么神?

其次就是编程能力,相较于o3和4o,GPT-5在思考模式加持之下,达到了74.9%的水平。

_GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?

除此之外,这个模型在多种多模态评测中表现出色,覆盖了图像、视频、空间理解和科学推理等方面。

更强的多模态能力,意味着ChatGPT在处理图片和其他非文字信息时更聪明了——比如看懂图表、总结一张演示照片的内容,或者回答关于图示的问题。

_GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?

而且比较罕见的是,第三方的大模型竞技场(Imarena.ai)也是及时跟进,直接发表声明:“全方面第一”。

具体而言,竞技场涉及的内容包括:文本、Web开发、视觉、编程、数学、创造力、长查询等。

GPT-5发布了,到底有没有那么神?__GPT-5发布了,到底有没有那么神?

由此可见,GPT-5从目前评测标准来看,确实是AI大模型的卫冕之王。

再看效果

成绩是一方面,但实际效果才是硬道理。

深谙此理的Sam Altman在自己的X账号上也是立马跟进,发布了由GPT-5生成的效果:

_GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?

并且Altman还表示,有GPT-5权限的用户,只需发送“use beatbot to make a sick beat to celebrategpt-5”即可体验。

不多不说,营销这块,Altman还是非常手拿把掐的。

不过在直播的现场演示过程中,GPT-5还是有不少惊艳的表现在身上的。

例如让GPT-5生成一个学语法的APP,效果是这样的:

GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?_

不要以为是简单的网站,除了可以完成市面上AI的交互之外,它在里面还可以内嵌一个小游戏(点击“Mouse&Cheese”):

GPT-5发布了,到底有没有那么神?__GPT-5发布了,到底有没有那么神?

并且若是想改变APP里面的内容,只要一句话,瞬间(现场实测)就可以改变布局:

GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?_

对于更加庞大且复杂的项目,例如现场OpenAI展示了用GPT-5先编程出来的代码:

GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?_

在运行之后,便得到了一个3D效果的“世界”:

GPT-5发布了,到底有没有那么神?__GPT-5发布了,到底有没有那么神?

总而言之,从现场效果来看,GPT-5也是担得起“最聪明、最强编程”的大模型。

“观众”们买单吗?

从目前X上“观众”的反馈来看,讨论最激烈的就是前面我们提到的图表bug。

甚至有网友做了一张简单粗暴的Excel表格来讽刺这次的失误:

GPT-5发布了,到底有没有那么神?__GPT-5发布了,到底有没有那么神?

不过另一方面,老东家微软CEO火速出面站台,并配有一个“爱心”图片以表支持:

GPT-5发布了,到底有没有那么神?_GPT-5发布了,到底有没有那么神?_

再如开发者们常用的VS Code,官方也是Day 0无缝衔接GPT-5:

GPT-5发布了,到底有没有那么神?__GPT-5发布了,到底有没有那么神?

不过对于普罗大众来说,反馈声音最大的莫过于:“说好的免费,我的ChatGPT咋没有呢?”

总而言之,用户到底买不买单,实测效果到底有没有那么神,需要让子弹再飞一会了。

1、https://openai.com/index/introducing-gpt-5/

2、https://x.com/EgeErdil2/status/1953505551570415718

相关文章

ETF今日收评 | 稀土相关ETF涨超6%,人工智能、影视相关ETF涨超5%

ETF今日收评 | 稀土相关ETF涨超6%,人工智能、影视相关ETF涨超5%

市场全天震荡走强,沪指创近10年新高,北证50创历史新高。盘面上,市场热点集中在AI硬件和大金融方向,个股涨多跌少,全市场超4000只个股上涨。从板块来看,券商、金融科技等大金融股一度冲高,液冷服务器...

AI Agent行业应用价值及全球市场机遇洞察

AI Agent行业应用价值及全球市场机遇洞察

AI Agent 核心基础能力 AI Agent(人工智能代理) 是一种能够感知外部环境、自主决策并规划执行具体动作及流程以实现特定任务目标的智能实体。它结合了感知、推理、学习和行动能力,能够...

MWC 人形机器人集结号:从技术秀到大规模落地,还差几块拼图?|直击MWC上海2025

MWC 人形机器人集结号:从技术秀到大规模落地,还差几块拼图?|直击MWC上海2025

六月中旬的上海,热浪袭人,却挡不住科技热潮。6月18日至20日,2025世界移动通信大会(MWC上海)在浦东新国际博览中心举行,现场人头攒动,盛况空前。 自1995年首度举办以来,MWC始终扮演着全球...

A股半年报“交卷”!近八成公司盈利,人工智能引领增势

A股半年报“交卷”!近八成公司盈利,人工智能引领增势

又到A股上市公司半年报“交卷时刻”,不同行业板块公司的经营轮廓逐渐清晰。大部分企业交出了一份可圈可点的中期答卷,展现出上市公司稳健运营的态势。 据证券时报记者不完全统计,截至8月29日晚间发稿,A股...

突发公告,居然智家实控人汪林朋被留置!身家125亿元,一个月前还参加公司新春座谈会

突发公告,居然智家实控人汪林朋被留置!身家125亿元,一个月前还参加公司新春座谈会

4月17日晚,居然智家(SZ000785)披露,收到公司实际控制人、董事长兼CEO汪林朋家属的通知:其于近日收到由武汉市江汉区监察委员会签发的关于汪林朋先生的《留置通知书》和《立案通知书》。 公司表...

腾讯,连发重磅!

腾讯,连发重磅!

7月27日,在2025世界人工智能大会(WAIC 2025)这一全球瞩目的盛会上,科技巨头腾讯公司重磅发布了一系列AI最新成果和全新升级,覆盖业务广泛,包括大模型、具身智能、游戏业务、智能体等多个方面...

发表评论    

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。
客服微信:BT86616点击复制并跳转微信