北京时间8月8日凌晨,OpenAI正式发布新一代AI模型GPT-5。这款被Sam Altman称为"第一部配备视网膜显示屏的iPhone"的模型,在文本、编码、数学等多项基准测试中全面领先,标志着AI技术向超级智能迈出关键一步。
GPT-5在WebDev、视觉感知、硬提示等领域的表现均排名第一,Arena测试分数创下新高。OpenAI测试数据显示,其联网搜索错误率比GPT-4o降低45%,独立思考错误率更是下降80%。Sam Altman将其比作"博士级专家",与GPT-4o的"大学生"水平形成鲜明对比。
GPT-5系列包含标准版、mini、nano和chat四个版本。最显著的改进包括:引入路由系统自动切换推理模式;大幅减少"AI幻觉"问题;新增犬儒、机器人等四种人格模式;支持自定义界面主题。ChatGPT负责人Nick Turley表示,这些改变将显著提升普通用户的使用体验。
GPT-5在SWE-Bench等编码测试中表现优异,人类最终测试达到42%准确率。发布会上,OpenAI演示了其秒建法语学习网站、生成3D游戏等能力。Altman预测,这将开启"软件按需生成"的新时代。
经过5000小时安全测试的GPT-5新增"安全补全"机制,在保持安全前提下提供更全面的回答。所有ChatGPT用户均可免费使用基础版,Pro用户可访问更强推理能力的Pro版本。微软CEO纳德拉同时宣布,GPT-5已全线接入微软生态。
尽管成就显著,Altman坦言GPT-5距离真正的AGI仍有差距。这位OpenAI掌门人表示:"这是需要通用智能模型才能做到的进步,但它仍缺少某些重要特质。"随着GPT-5的发布,AI行业正式进入超级智能竞赛的新阶段。