2月20日,谷歌DeepMind正式官宣推出新一代旗舰AI模型Gemini 3.1 Pro,该模型在核心推理能力上实现跨越式突破,实测推理性能较上一代Gemini 3 Pro提升超一倍,同时保持原有定价不变,以技术普惠姿态搅动全球AI模型竞争格局,引发科技圈与产业界的广泛关注,清华物理系传奇人物姚顺宇也发文官宣新模型发布,称“更好的Gemini模型正以势不可挡的速度涌现”。

推理能力的全面升级是Gemini 3.1 Pro的核心亮点,其在衡量抽象逻辑推理能力的ARC-AGI-2基准测试中斩获77.1%的高分,不仅是上一代Gemini 3 Pro(31.1%)的两倍以上,更超越了Claude Opus 4.6(68.8%)、GPT-5.2(52.9%)等同类顶尖模型,成绩接近人类平均水平,标志着AI开始具备真正的逻辑推演能力,打破了此前AI“记忆强、思考弱”的行业痛点。
实测数据显示,Gemini 3.1 Pro的推理能力已实现从“理论突破”到“实用落地”的跨越,在多个专业领域的任务准确率大幅提升:医疗场景中,辅助诊断准确率从47%提高至67%;法律领域,合同条款矛盾识别准确率从57%跃升至74%,可生成带详细注释的法律分析报告;甚至能通过符号推理,从历史账本中的“145”推断出“14磅5盎司”的计量逻辑,展现出强大的复杂问题处理能力。
除了核心推理性能的翻倍提升,Gemini 3.1 Pro在多模态创作、复杂项目开发等领域也表现亮眼。该模型支持百万级token上下文,可一次性消化整本书或数小时会议记录,长文档信息提取准确率超90%;能根据简单文本提示,生成可直接运行的轻量级Windows 11 WebOS、“我的世界”式3D沙盒应用,还能绘制高精度SVG动画,其生成的鹈鹕骑自行车动画,在身体结构、骑行姿态及细节完整性上远超上一代模型。
值得关注的是,谷歌采取“加量不加价”的策略,Gemini 3.1 Pro的API定价与上一代保持完全一致,提示词20万token以内,每百万token输入仅需2美元(约合人民币14元),远低于Anthropic Opus 4.6等同类模型,这一举措打破了行业“越贵越好”的溢价逻辑,让中小企业无需高昂投入就能使用顶尖AI推理能力,打破大企业技术垄断。目前,该模型已面向开发者、企业用户及普通用户开放,Google AI Pro、Ultra订阅用户可直接使用,免费用户可体验2次提问权限。
业内人士分析认为,Gemini 3.1 Pro的发布,标志着AI行业竞争正式进入以推理能力和实际解决问题为核心的新阶段。其推理性能的翻倍提升的同时,进一步拉低了顶尖AI技术的使用门槛,不仅将倒逼Anthropic、OpenAI等同行加速模型迭代,还将推动AI在科研、法律、医疗、创意编程等领域的深度落地,让AI从“辅助工具”真正升级为“核心生产力”,深刻重塑全球AI产业的竞争格局。
© 版权声明
文章版权归作者所有,未经允许请勿转载。


