谷歌发布Gemini 3.1 Pro，推理性能较上一代提升超一倍

55 0 0

2月20日，谷歌 DeepMind正式官宣推出新一代旗舰AI模型Gemini 3.1 Pro，该模型在核心推理能力上实现跨越式突破，实测推理性能较上一代Gemini 3 Pro提升超一倍，同时保持原有定价不变，以技术普惠姿态搅动全球AI模型竞争格局，引发科技圈与产业界的广泛关注，清华物理系传奇人物姚顺宇也发文官宣新模型发布，称“更好的Gemini模型正以势不可挡的速度涌现”。

推理能力的全面升级是Gemini 3.1 Pro的核心亮点，其在衡量抽象逻辑推理能力的ARC-AGI-2基准测试中斩获77.1%的高分，不仅是上一代Gemini 3 Pro（31.1%）的两倍以上，更超越了Claude Opus 4.6（68.8%）、GPT-5.2（52.9%）等同类顶尖模型，成绩接近人类平均水平，标志着AI开始具备真正的逻辑推演能力，打破了此前AI“记忆强、思考弱”的行业痛点。

实测数据显示，Gemini 3.1 Pro的推理能力已实现从“理论突破”到“实用落地”的跨越，在多个专业领域的任务准确率大幅提升：医疗场景中，辅助诊断准确率从47%提高至67%；法律领域，合同条款矛盾识别准确率从57%跃升至74%，可生成带详细注释的法律分析报告；甚至能通过符号推理，从历史账本中的“145”推断出“14磅5盎司”的计量逻辑，展现出强大的复杂问题处理能力。

除了核心推理性能的翻倍提升，Gemini 3.1 Pro在多模态创作、复杂项目开发等领域也表现亮眼。该模型支持百万级token上下文，可一次性消化整本书或数小时会议记录，长文档信息提取准确率超90%；能根据简单文本提示，生成可直接运行的轻量级Windows 11 WebOS、“我的世界”式3D沙盒应用，还能绘制高精度SVG动画，其生成的鹈鹕骑自行车动画，在身体结构、骑行姿态及细节完整性上远超上一代模型。

值得关注的是，谷歌采取“加量不加价”的策略，Gemini 3.1 Pro的API定价与上一代保持完全一致，提示词20万token以内，每百万token输入仅需2美元（约合人民币14元），远低于Anthropic Opus 4.6等同类模型，这一举措打破了行业“越贵越好”的溢价逻辑，让中小企业无需高昂投入就能使用顶尖AI推理能力，打破大企业技术垄断。目前，该模型已面向开发者、企业用户及普通用户开放，Google AI Pro、Ultra订阅用户可直接使用，免费用户可体验2次提问权限。

业内人士分析认为，Gemini 3.1 Pro的发布，标志着AI行业竞争正式进入以推理能力和实际解决问题为核心的新阶段。其推理性能的翻倍提升的同时，进一步拉低了顶尖AI技术的使用门槛，不仅将倒逼Anthropic、OpenAI等同行加速模型迭代，还将推动AI在科研、法律、医疗、创意编程等领域的深度落地，让AI从“辅助工具”真正升级为“核心生产力”，深刻重塑全球AI产业的竞争格局。