OpenAI推出GPT-5.2,与谷歌的Gemini 3争夺人工智能模型霸权! 人工智能巨头OpenAI声称,新版本的性能“达到或高于人类专家水平”。 OpenAI发布了GPT-5.2,声称与11月发布的GPT-5.1相比,人工智能模型在“专家级”完成现实世界业务任务的能力方面取得了重大进展。该公司表示,新型号有Instant、Thinking和Pro性能等级,在一系列基准测试中都有重大改进。使用OpenAI的GDPval基准,将模型完成44项不同业务任务的能力与人类专家的相同标准进行比较,GPT-5.2在70.9%的测试中与人类用户匹配或超过人类用户,而GPT-5.1在Instant(基本)、Thinking(深入推理)和Pro(研究级)版本中的匹配率为38.8%。为了说明这些进步,OpenAI表示,GPT-5.2 Thinking可以完全格式化劳动力规划电子表格,而在GPT-5.1上,等效输出正确地组装了相同的电子表格,但处于缺乏格式化的更基本状态。 OpenAI表示:“我们设计GPT-5.2是为了为人们释放更多的经济价值;它更擅长创建电子表格、构建演示文稿、编写代码、感知图像、理解长上下文、使用工具以及处理复杂的多步骤项目。”。GPT-5.2还显示了其他重要基准测试的混合收益,包括ARC-AGI-1/ARC-AGI-2(一般问题解决)和SWE Bench Pro/SWE Bench Verified(真实世界的软件任务)。该公司表示:“对于日常专业使用,这转化为一种模型,可以更可靠地调试生产代码、实现功能请求、重构大型代码库,并在较少的人工干预下端到端地发布修复。”。 GPT-5.2已经开始向ChatGPT用户推出,从付费计划开始。订阅价格不变。对于API访问,GPT-5.2的定价为每一百万个输入令牌1.75美元,每一百万个输出令牌14美元,缓存输入有90%的折扣。尽管这比GPT-5.1更昂贵,但OpenAI声称,该模型的更高效率意味着“由于GPT-5.2的更高令牌效率,达到给定质量水平的成本最终会更低”。AI价值重估 开源AI模型 ai开发模型 gpt5.0
