IBM 推出第三代 Granite 大语言模型Granite 3.0,加速企业 AI 发展

IBM 在企业 AI 领域的布局正在加速。今天,IBM 宣布推出第三代 Granite 大语言模型(LLMs),进一步扩展其企业 AI 业务。这一代模型的核心是继续专注于真正的开源企业 AI,并利用其 InstructLab 功能确保模型可以为企业的具体需求进行微调。

现在可以使用Ollama运行一批IBM Granite 3.0模型,所有模型均在标准Apache 2.0许可证下提供。

新模型概述

IBM 推出的新一代 Granite 模型包括:

  • 通用模型:Granite 3.0,分别有20亿和80亿参数的版本。
  • 混合专家(MoE)模型:包括 Granite 3.0 3B A800M Instruct、Granite 3.0 1B A400M Instruct、Granite 3.0 3B A800M Base 和 Granite 3.0 1B A400M Base。
  • 优化防护和安全选项:Granite Guardian 3.0 8B 和 Granite Guardian 3.0 2B 模型。

这些新模型将在 IBM 的 watsonX 服务以及 Amazon Bedrock、Amazon SageMaker 和 Hugging Face 上提供。

IBM 的企业 AI 业务增长

IBM 高级副总裁兼首席商务官 Rob Thomas 在与媒体和分析师的简报中表示:“我们在生成式 AI 上建立的业务现在在技术和咨询方面已经超过20亿美元。回顾我在 IBM 的25年,我不确定我们是否曾经有过一个以这种速度扩展的业务。”

Granite 3.0 的特点与优势

1. 数据质量和架构创新

  • 数据质量:新模型由 IBM 的集中数据模型工厂团队训练,使用了12万亿 Token 的数据,包括多种语言的语言数据和代码数据。
  • 架构创新:与前几代相比,关键区别在于数据的质量和训练过程中使用的架构创新。

2. 安全性和信任

  • Guardian 模型:IBM 开发了先进的“Guardian”模型,可以防止核心模型被破解或产生有害内容。

3. 模型大小的灵活性

  • 推理成本:IBM 非常重视模型大小的选择,以平衡性能和推理成本,使其更适合企业中的扩展用例。

4. 开源许可证

  • Apache 2.0 许可证:IBM 决定在 OSI 批准的 Apache 2.0 开源许可证下发布模型,为合作伙伴提供最大的灵活性。

企业用例与生态系统的构建

IBM 预计新模型将支持一系列企业用例,包括:

  • 客户服务
  • IT 自动化
  • 业务流程外包(BPO)
  • 应用程序开发
  • 网络安全

通过提供宽松的 Apache 2.0 许可证,IBM 希望培育一个由 Granite 技术驱动的强大解决方案和应用程序生态系统。

展望未来:生成计算

IBM 正在思考下一个重大的范式转变,称为生成计算。生成计算指的是通过提供示例或提示来编程计算机,而不是明确地写出逐步指令。这与 Granite 等 LLM 的能力相一致,它们可以根据接收到的输入生成文本、代码和其他输出。

IBM 研究高级副总裁兼总监 Dario Gil 表示:“这种我们不编写指令,而是通过示例编程计算机的方式是根本性的,我们才刚刚开始通过与 LLM 的互动来感受这种方式。你将看到我们在这个生成计算范式的方向上进行投资并非常积极地推进,我们将能够实现下一代模型、智能框架以及更多。”

我们将24小时内回复。
取消