1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。根据LisanBench最新跑分,GPT-5.5 Pro文本IQ 130踩上门萨会员线,视觉IQ直接飙到145,杀进天才区。一年前「LLM过不了130」还是技术圈共识,今天,这堵墙彻底被砸碎!![]()
1946年至今,「人类最高智商俱乐部」门萨将迎来第一位非人类成员。
GPT-5.5 Pro,在线文本智商133,视觉智商145,线下非公开智商测试得分130。
![]()
![]()
这是AI第一次正式跨过门萨会员线。
门萨 130墙这一脚是最响的一脚,但绝对不会是最后一脚。
门萨,全球最古老的高智商社团,1946年成立,入会标准只有一条——
智商IQ达到全人类前2%,分数线130。普通人考几次都摸不到边的那条线,AI一次就过了。
![]()
而145,是门萨官网公开数据里「前0.1%」的位置,俗称天才区。
![]()
这并非孤例。就在本月初,GPT-5.4 Pro 已经在TrackingAI公开榜单上跑出150 IQ,登顶所有公开IQ跑分。
![]()
过去几个月里,也是OpenAI节奏从未停:视觉基座、推理升级、Agent产品线、API侧连环动作。
现在,AI赛场再次进入了OpenAI时代。
短板变王牌,OpenAI引爆认知视觉革命更炸的是文本和视觉的差距:GPT-5.5 Pro在文本部分跑出130分,刚好压线进门萨,但视觉部分直接飙到145。
15分的差距,不是测试误差。
这意味着模型在「看图找规律」这件事上的能力,比「读题做推理」高出整整一个标准差。
按照门萨的分布,130是前2%,145是前0.1%。也就是说,把GPT-5.5 Pro的视觉能力拿出去和真人比,真正的千里挑一。
这里有个细节值得多说一句:为什么是视觉,而不是文本,先把墙撞碎的?
门萨Norway采用3×3九宫格格式(八张图+空缺第九张),完全非语言、非文化依赖,考察抽象推理。
人类高智商群体(尤其是140+「天才区」)确实依赖瞬间模式识别:旋转(rotation)、镜像/反射(mirroring/reflection)、叠加/增减元素(superposition/addition-subtraction)等变换规则。
![]()
LLM做这种题的标准方法,是先把图片转成token再推理。
但token化的过程,丢的恰恰是空间结构和拓扑关系——也就是这类题最核心的信息。
所以,过去十二个月,所有顶级模型在视觉题上都是这个状况:文本勉强及格,视觉一塌糊涂。
Claude 4.7、GPT-5.4 Pro全部卡在 125 以下。
GPT-5.5 Pro的145意味着:这不是在模拟思考,这是在重构智能。 过去我们嘲笑AI「不懂常识」,而现在,它正在以高于98%人类的智力水平,俯视着我们的常识。
OpenAI联合创始人、总裁Greg Brockman转发用户展示,力荐GPT Image 2将《物种起源》等书籍瞬间转为详细信息图,促进高效学习。
![]()
![]()
这揭示了人类文明的一个重大转折点:知识的摄入媒介变了。
数千年来,人类依赖文字这种低带宽的线性媒介来传递智慧。
但GPT-5.5告诉我们,未来的学习不再需要你花费三个月去咀嚼一本厚书,AI会通过对长文本的深度语义理解,将其重构为一种「视觉认知流」。
这是「语义重组」。
![]()
![]()
![]()
![]()
![]()
![]()
![]()
当AI的记忆力和上下文处理能力不再「健忘」,它就成了你大脑外的另一层皮质层。你不再是阅读知识,而是在俯瞰知识。
此外,ChatGPT现在一键直接把老旧破损的图片变成4K画质,而且免费!
「勤勉的小火车头」:说最温柔的话,做最狠的事奥特曼用了一个极具迷惑性的词:「小火车头」(little engine)。
![]()
这个听起来甚至有些软萌的比喻背后,隐藏着 OpenAI 极度冷酷的商业意志。
昨天,OpenAI API新品登场:GPT-5.5及Pro版现已可用,显著提升智能水平和token效率,完美适配复杂任务场景,如编码、分析等高负载应用。
![]()
在LisanBench测试中,GPT-5.5是最强的双料非推理模型!
![]()
![]()
更令人胆寒的是, GPT-5.5的Token使用减少45.6%,智能分数却提升了1.77倍。
自从GPT-5以来,OpenAI模型的推理效率持续提升:
![]()
当前有效性比率排行榜中GPT 5.5独占鳌头:
GPT 5.5(Medium):99.44%
Opus 4.7 (xhigh): 99.35%
Sonnet 4.6 (16k): 99.28%
Opus 4.6 (16k): 98.74%
Gemini 3.1 Pro预览版(低):97.77%
测试之后,AI行业分析机构SemiAnalysis坦承:在某些任务上的表现,GPT-5.5已经显著超越了所有其他模型。
在数学上,GPT-5.5表现最佳;
在编程上,GPT-5.5和Opus 4.7各有千秋;
在智能体任务上,Claude和GPT-5.5远胜于其他所有模型。![]()
![]()
这意味着什么?这意味着 OpenAI 正在同时「垄断智力」和「降维成本」。
对于竞争对手,这几乎是一场无解的「降维打击」。
特别是,Claude系列这次迎来了真正的对手,只剩下「神话中的Myhos」尚能一战。
![]()
已经有Claude忠实支持者,转为OpenAI Codex用户。
![]()
![]()
当你的产品比对手聪明一倍,延迟却只有对方的一半时,市场规则已经失效了,剩下的只有收割。
但对于开发者来说,这种「诚恳的能量」却带来了一种「西西弗斯式的焦虑」。
OpenAI加速狂飙,每月一炸上个月,OpenAI 才刚刚发布了一个模型,再之前是去年12月,以及去年11月。
![]()
OpenAI正以快速、稳健的步伐持续推出新模型,在Artificial Analysis智能指数上稳步前行。
![]()
AI仍在加速 ,指数效应开始显现,奇点触手可及!
![]()
在可预见的未来,这一趋势有望延续。
「我们在短期内看到了相当显著的进步,在中期内看到了极其显著的进步,」OpenAI首席科学家Jakub Pachocki 说。「事实上,我认为过去两年其实出奇地缓慢。」
Brockman表示,该模型也是朝着创建「超级应用」迈出的又一步。
所谓「超级应用」,就是一个像瑞士军刀一样的多功能程序。Brockman与联合创始人奥特曼此前曾设想将 ChatGPT、Codex 和 AI 浏览器整合到一个统一的服务中,为企业客户提供支持。
值得注意的是,「超级应用」也是Elon Musk热衷的话题。
OpenAI官宣的「Crisp Pace」——每月一炸的更新频率,让所有的集成、优化和 Prompt 工程都变成了一次性用品。你昨晚刚熬夜调优好的工作流,今天可能就被 GPT-5.5 的原生能力直接覆盖。
被压缩的窗口期这件事的真正分量,不在跑分本身,在节奏。
去年视觉天花板还停在119。今年直接跳到145。中间没有过渡,没有预告,只有一行更新。
在这种速度面前,一切「熟练度」都正在贬值。
正如尤瓦尔·赫拉利所言,历史上第一次,我们无法预测20年后人类的就业市场是什么样。 但现在,这个窗口期可能被OpenAI缩短到了20个月。
那个「诚恳的小火车头」已经拉响了汽笛,它不打算等任何人。如果你感受到了颠簸,那是时代在换轨。
技能的半衰期正在被这种迭代速度反复缩短。不是十年,不是五年,是按月计算。
赞(47)