编译/前方智能
谷歌近日发布了其最新的开源 AI 模型 Gemma 3,声称其为“全球最强单加速器模型”。Gemma 3 基于与 Gemini 2.0 模型相同的研究和技术,旨在实现高性能和高效率,尤其是在资源受限的环境中。
图源:谷歌
Gemma 3 提供 1B、4B、12B 和 27B 四种参数规模,支持超过 35 种语言,并具备分析图像、文本和短视频的多模态能力。谷歌强调,Gemma 3 在 LMArena 排行榜上的初步人类偏好评估中,超越了 Llama-405B、DeepSeek-V3 和 o3-mini 等大型语言模型。
Gemma 3 在使用单个英伟达 H100 GPU 时,达到了 DeepSeek-R1 模型 98% 的准确率,而 R1 模型据估计需要 32 个 H100 GPU。此外,Gemma 3 还超越了 Meta 的 Llama 3。Gemma 3 引入了 128k token 的上下文窗口,并支持函数调用和结构化输出,以帮助自动化任务和构建代理体验。
为了进一步降低计算成本,谷歌推出了 Gemma 3 的量化版本,通过降低模型权重的数值精度,在保持高准确率的同时,减少模型大小和计算需求。