Google 将于 5 月 20 日在 I/O 上推出 Gemini 3.2 Flash,并以 1/15 成本实现与 GPT-5.5 相匹配的性能

AT0.1%
ON-23.42%
MAY-2.87%

据 Abacus.AI 首席执行官 Bindu Reddy 称,Google 计划在 5 月 20 日的 I/O 大会上发布 Gemini 3.2 Flash,其在代码和推理任务上的性能将达到 GPT-5.5 的 92%,同时将推理成本削减至仅为后者的 1/15 到 1/20。大多数查询的延迟将低于 200 毫秒。Reddy 将这一突破归因于 Google 的蒸馏和稀疏性技术,这些技术能在不出现通常在模型优化中所见的性能断崖的情况下,将前沿模型压缩到 Flash 级别。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明
评论
0/400
暂无评论