摘要
谷歌发布了Gemini 3 Flash模型,该模型运行速度为Gemini 2.5 Pro的三倍,成本仅为Gemini 3 Pro的四分之一。在SWE-bench编程基准测试中,其得分甚至超越了同门的Gemini 3 Pro。发布当天,该模型即成为Gemini App和谷歌搜索AI模式的默认模型,标志着谷歌正通过其分发渠道,将高效能AI快速推向市场,以应对与OpenAI的竞争。
线索
谷歌此次发布的Gemini 3 Flash,其核心投资线索在于“效率”与“分发”的结合。
机会方面:1)强大的分发网络是谷歌的核心护城河。将新模型迅速部署于搜索和自有应用,能立即触达数十亿用户,形成数据飞轮和用户习惯壁垒,这是竞争对手难以复制的优势。2)极致的成本效益。Flash的定价和更低的token消耗量,对企业客户极具吸引力,有望加速其在谷歌云(Vertex AI)上的商业化落地,吸引如桥水、Salesforce等大型客户,提升云业务收入。3)技术实力的体现。Flash在多项基准测试中接近或超越旗舰模型,表明谷歌在模型压缩和效率优化上取得突破,有能力在控制成本的同时提供高性能服务。
风险方面:1)竞争白热化。OpenAI等对手正以同样快的速度迭代,技术领先窗口期极短,高昂的研发投入可能侵蚀利润。2)盈利压力。超低定价策略可能引发价格战,虽然能抢占市场份额,但短期内对AI业务的直接盈利能力构成挑战。3)用户迁移成本。尽管分发优势明显,但ChatGPT仍占据大量用户时长,改变用户习惯需要时间,且AI整合进核心搜索产品若体验不佳,可能反噬品牌声誉。
正文
谷歌公司宣布推出Gemini 3家族的新成员Flash。该模型主打快速与高效,在发布当天即取代Gemini 2.5 Flash,成为Gemini应用程序的默认模型,并同步成为谷歌搜索AI模式的默认驱动系统。
谷歌DeepMind的Gemini产品管理高级总监Tulsee Doshi表示,Flash模型保持了接近Gemini 3 Pro的推理能力,同时运行速度达到Gemini 2.5 Pro的三倍,成本仅为Gemini 3 Pro的四分之一。Doshi称,通过Gemini 3 Flash,谷歌将强大的模型能力带给更广泛的用户。
在评估代理编程能力的基准测试SWE-bench Verified中,Gemini 3 Flash的解决率达到78%,高于Gemini 3 Pro的76.2%。
此次发布正值谷歌与OpenAI的竞争持续。谷歌于11月18日发布Gemini 3系列,随后OpenAI推出了GPT-5.2和新的图像生成模型作为回应。数据显示,Gemini在每周移动应用下载量、月活跃用户和全球网站访问量等指标上的增长率近期超过了ChatGPT,但ChatGPT在11月下旬仍占据90%的移动端会话。
自Gemini 3发布以来,谷歌API每天处理的token数量已超过1万亿。
性能基准测试结果
Gemini 3 Flash在多项基准测试中展现出接近或超越更大型模型的表现:
* SWE-bench Verified:解决率为78%,仅次于GPT-5.2的80%,优于Gemini 3 Pro的76.2%。
* Humanity’s Last Exam(无工具):得分33.7%,低于Gemini 3 Pro的37.5%和GPT-5.2的34.5%,但远超Gemini 2.5 Flash的11%。
* MMMU-Pro(多模态推理):得分81.2%,超越了包括Gemini 2.5和Gemini 3 Pro在内的所有其他对比模型。
* GPQA Diamond(博士级推理):得分为90.4%,低于GPT-5.2的92.4%和Gemini 3 Pro的91.9%。
成本与效率
Gemini 3 Flash的定价为每100万输入token 0.50美元,每100万输出token 3.00美元。该价格略高于Gemini 2.5 Flash,但性能超越Gemini 2.5 Pro,速度是其三倍。
在处理需要思考的任务时,Gemini 3 Flash平均使用的token数量比Gemini 2.5 Pro少30%,这有助于在某些任务中降低用户的总体成本。此外,该模型配备标准上下文缓存功能,在重复使用token的应用中可实现高达90%的成本削减。谷歌强调,Gemini 3 Flash能够以不到Gemini 3 Pro四分之一的成本支持AI代理工作流。
产品覆盖与企业应用
Gemini 3 Flash面向全球消费者、开发者和企业用户推出。
* 消费者:在Gemini App中免费作为默认模型提供,用户可切换至Pro模型。在美国,谷歌搜索的AI模式默认使用Flash,深度思考任务可访问Gemini 3 Pro。
* 开发者:通过Google AI Studio、Gemini CLI、Vertex AI和代码工具Antigravity提供预览版。
* 企业:通过Vertex AI和Gemini Enterprise提供服务。
多家企业已开始采用Gemini 3 Flash:
* JetBrains:其AI工具生态系统负责人表示,Gemini 3 Flash提供了接近Gemini 3 Pro的质量,同时推理延迟和成本显著降低。
* 桥水:其AIA Labs负责人兼首席科学家表示,Gemini 3 Flash是第一个以其工作流程所需的速度和规模提供Pro级深度的模型。
* 其他采用该模型的公司还包括Salesforce、Workday、Figma、Cursor、Harvey和Latitude。
谷歌搜索产品副总裁Robby Stein表示,新模型将帮助用户处理具有多个条件的更精细搜索。
发布时间
2025-12-18T02:21:40+00:00



评论 ( 0 )