谷歌Gemma入场,性能超Llama-2,可商用

谷歌Gemma入场,性能超Llama-2,可商用

谷歌在大模型领域又有了新动作:重磅推出了一系列轻量级、先进的开放模型 Gemma,其名字来自拉丁语 gemma,意为“宝石”。

官方页面:https://ai.google.dev/gemma/

介绍链接:https://blog.google/technology/developers/gemma-open-models/

技术报告https://storage.googleapis.com/deepmind-media/gemma/gemma-report.pdf

谷歌Gemma入场,性能超Llama-2,可商用

谷歌Gemma入场,性能超Llama-2,可商用

Google DeepMind 首席执行官 Demis Hassabis 在 X 上表示,“我们长期以来一直支持负责任的开源和科学,这可以推动快速的研究进展,因此我们很自豪地发布了 Gemma”。

谷歌Gemma入场,性能超Llama-2,可商用

本次发布包含两种权重规模的模型:Gemma 2B 和 Gemma 7B。每种规模都有预训练和指令微调版本。想使用的人可以通过 Kaggle、谷歌的 Colab Notebook 或通过 Google Cloud 访问。

Gemma 也上线了 HuggingFace 和 HuggingChat,国内用户也能第一时间体验。

谷歌Gemma入场,性能超Llama-2,可商用

一些关键细节如下(截图源自学术头条):

谷歌Gemma入场,性能超Llama-2,可商用

Keras 作者也对此直接表示:最强开源大模型的位置现在易主了。

谷歌Gemma入场,性能超Llama-2,可商用

据官方报道,Gemma 模型与 Gemini 共享技术和基础设施组件,Gemini 是目前广泛使用的最大、功能最强大的 AI 模型。与其他开放式型号相比,这使得 Gemma 2B 和 7B 能够在其尺寸上实现一流的性能。Gemma 型号能够直接在开发人员笔记本电脑或台式计算机上运行。值得注意的是,Gemma 在关键基准上明显超越了更大的模型,同时遵守我们对安全和负责任输出的严格标准。

谷歌Gemma入场,性能超Llama-2,可商用

谷歌Gemma入场,性能超Llama-2,可商用

谷歌方面表示,为适应特定的应用需求,比如汇总或检索增强生成(RAG),开发者可以使用自己的数据对 Gemma 模型进行微调。

目前,Gemma 支持多种工具和系统:

  • 多框架工具:使用最喜欢的框架,在多框架 Keras 3.0、本地 PyTorch、JAX 和 Hugging Face Transformers 中进行推理和微调的参考实现。
  • 跨设备兼容性:Gemma 模型可在笔记本电脑、台式机、物联网、移动和云等流行设备类型中运行,从而实现广泛的 AI 功能。
  • 尖端硬件平台:谷歌与英伟达合作,针对英伟达 GPU 优化 Gemma,从数据中心到云端再到本地 RTX AI PC,确保业界领先的性能和与尖端技术的集成。
  • 针对谷歌云进行了优化:Vertex AI 提供广泛的 MLOps 工具集,具有一系列调整选项,并可使用内置推理优化功能进行一键式部署。可使用完全管理的 Vertex AI 工具或自主管理的 GKE 进行高级定制,包括部署到任何平台的 GPU、TPU 和 CPU 上具有成本效益的基础设施。

谷歌Gemma入场,性能超Llama-2,可商用

原创文章,作者:特工宇宙,如若转载,请注明出处:https://www.agent-universe.cn/2024/02/2575.html

Like (0)
Previous 2024-02-21 18:38
Next 2024-02-22 13:56

相关推荐