Gemma3 – 当前最强大的单GPU模型
Gemma3 是当前最强大的单GPU模型。该模型的参数有四种规格可供选择:1B、4B、12B和27B,适用于不同的任务需求。Gemma3 是基于Google的Gemini技术构建的轻量级多模态模型,可以处理文本和图像,支持超过140种语言,并提供128K的上下文窗口。其设计紧凑,适合在资源有限的设备上部署。
在模型参数方面,具体的指标如下:
• 1B参数模型(32k上下文窗口)
• 4B参数模型(128k上下文窗口)
• 12B参数模型(128k上下文窗口)
• 27B参数模型(128k上下文窗口)
模型在文本生成方面的表现经过一系列基准测试进行评估,涵盖推理、逻辑和代码能力等不同方面。根据不同数据集和评估指标,Gemma3在各个参数规格下的表现如下:
• HellaSwag:1B为62.3,4B为77.2,12B为84.2,27B为85.6
• BoolQ:1B为63.2,4B为72.3,12B为78.8,27B为82.4
• PIQA:1B为73.8,4B为79.6,12B为81.8,27B为83.3
• 其他数据集的表现也在不同参数下有所不同,全面展示了Gemma3在处理语言任务时的强大能力。
在多模态能力的评估中,4B、12B和27B参数模型在多项指标上也显示出优越表现,如COCOcap、DocVQA等测试中均取得了理想的分数。
最后,需要注意的是,使用Gemma3模型需遵循Gemma使用条款,并要求安装Ollama 0.6或更高版本。
https://ollama.com/library/gemma3
https://news.ycombinator.com/item?id=43340785
#AI #Google link
Gemma3 是当前最强大的单GPU模型。该模型的参数有四种规格可供选择:1B、4B、12B和27B,适用于不同的任务需求。Gemma3 是基于Google的Gemini技术构建的轻量级多模态模型,可以处理文本和图像,支持超过140种语言,并提供128K的上下文窗口。其设计紧凑,适合在资源有限的设备上部署。
在模型参数方面,具体的指标如下:
• 1B参数模型(32k上下文窗口)
• 4B参数模型(128k上下文窗口)
• 12B参数模型(128k上下文窗口)
• 27B参数模型(128k上下文窗口)
模型在文本生成方面的表现经过一系列基准测试进行评估,涵盖推理、逻辑和代码能力等不同方面。根据不同数据集和评估指标,Gemma3在各个参数规格下的表现如下:
• HellaSwag:1B为62.3,4B为77.2,12B为84.2,27B为85.6
• BoolQ:1B为63.2,4B为72.3,12B为78.8,27B为82.4
• PIQA:1B为73.8,4B为79.6,12B为81.8,27B为83.3
• 其他数据集的表现也在不同参数下有所不同,全面展示了Gemma3在处理语言任务时的强大能力。
在多模态能力的评估中,4B、12B和27B参数模型在多项指标上也显示出优越表现,如COCOcap、DocVQA等测试中均取得了理想的分数。
最后,需要注意的是,使用Gemma3模型需遵循Gemma使用条款,并要求安装Ollama 0.6或更高版本。
https://ollama.com/library/gemma3
https://news.ycombinator.com/item?id=43340785
#AI #Google link