|
千呼万唤下,Gemini 3来了! 北京时间11月19日,Google正式发布最新一代人工智能模型Gemini 3。这款被CEO桑达尔·皮查伊称为“最智能模型”的产品,早在10月就已在业内掀起波澜,如今终于揭开面纱。 相较于早期试探性的“小步快跑”,Gemini 3的发布是一次做足准备的全面展示。Gemini团队介绍,“它不仅是全球领先的多模态理解模型,更是迄今为止最强大的智能体(Agentic)和氛围编程(Vibe Coding)模型——而这一切都构建在最先进的推力能力之上。” 看过Gemini 3评测表现的网友纷纷表示,“终于理解了为什么Google会成为股神巴菲特的‘最后一舞’。” 不给对手机会,碾压式领先重夺王位 刚一发布,Gemini 3几乎霸榜所有评测集,以1501分的成绩重夺LMArena大模型竞技场第一,反超昨日马斯克xAI才发布的Grok 4.1模型。
从测试结果不难看出,凭借领先的推理能力和强大的多模态功能,Gemini 3 Pro的性能均显著超越前一代版本模型Gemini 2.5 Pro,且对OpenAI最新模型GPT-5.1呈“碾压”式领先。 其中,在“人类终极考试”中,Gemini 3 Pro在未使用任何工具的情况下得分率达 37.5%。在GPQA Diamond 基准测试中,Gemini 3 Pro准确率高达91.9%。在“地狱模式”数学测试MathArena Apex中,以23.4% 达到了最先进水平,在数学领域为前沿模型树立了全新标杆。 除了文本能力,Gemini 3 Pro 在 MMMU-Pro 上取得 81% 的成绩,在 Video-MMMU 上达到 87.6%。同时,该模型在 SimpleQA Verified 基准测试中也斩获了当前最先进的 72.1% 得分,展现出其在事实准确性方面的显著进步。这意味着 Gemini 3 Pro已具备能够有效解决跨越科学和数学等广泛主题的复杂问题。 在AI界的图灵测试“ARC-AGI-2”中,Gemini 3 Pro拿下31.1%的高分,远超于GPT-5.1的17.6%。这意味着AI开始展现出一种近乎于人类的智力和思维方式,能够在从未见过的任务模式下进行推理,而非凭借死记硬背。 OpenAI联合创始人、CEO山姆·奥特曼和xAI创始人、CEO埃隆·马斯克纷纷点赞Google最新模型。奥特曼发推评价“Gemini 3看起来很不错”,马斯克表示“干得很好”。 即日起,Gemini全面融入谷歌的产品生态,这也是Google首次在产品发布当日就将Gemini 引入搜索。此外,Gemini 3今天也同步向 Gemini app 用户、AI Studio 和 Vertex AI 的开发者、以及全新的智能体开发平台 Google Antigravity 中同步推出。 从这足以看出一个平台级的野心——用AI定义整个Google生态的每个支点。 本次Gemini 3 Pro的深度思考版本模型尚未全面开放,但从测试表现上可以获知它的Benchmark水平比Gemini 3 Pro高了一个数量级。Google表示,将在未来几周向Google AI Ultra订阅者开放,目前还在安全评估。
|
|
1
![]() 鲜花 |
1
![]() 握手 |
![]() 雷人 |
![]() 路过 |
![]() 鸡蛋 |
业界动态|长春信息港
2025-11-19
2025-11-19
2025-11-19
2025-11-19
2025-11-19

请发表评论