资讯

Meta 开源 Llama 4 — 适合所有人的 400B 参数模型

Meta 通过 Llama 4 继续其开源使命,采用 400B MoE 架构,可以以极低的成本与专有模型相媲美。

AIcloud2026-02-035 分钟阅读

发生了什么

Meta 发布了 Llama 4,这是迄今为止功能最强大的开源模型。 旗舰模型采用混合专家 (MoE) 架构,总参数为 400B,但每次推理仅激活 52B 参数,实现与专有模型相当的性能,同时保持运行效率。

Llama 4 系列包括:

  • Llama 4 Scout (8B):用于边缘设备和快速推理的轻量级模型
  • Llama 4 Maverick (70B):强大的通用模型
  • Llama 4 Behemoth (400B MoE):与专有产品相媲美的旗舰型号

## 为什么它很重要

### 人工智能民主化 Llama 4 延续了 Meta 的承诺,即让每个人都能使用最先进的人工智能。 开放重量许可证允许:

  • 商业用途无需许可费
  • 针对特定领域的微调
  • 自托管部署以保护数据隐私
  • 社区驱动的改进和扩展

### 性能与成本 MoE 架构提供了卓越的性能成本比:

__代码_块_0__

虽然与顶级专有模型不完全匹配,但 Llama 4 Behemoth 在自托管时的成本却非常接近。

基础设施生态系统

主要云提供商已经宣布支持 Llama 4:

  • AWS:可在 SageMaker 和 Bedrock 上使用
  • Azure:可在 Azure AI 上使用
  • Google Cloud:可在 Vertex AI 上使用
  • Together AI:优化推理 API
  • Ollama:本地部署支持

## 关键技术细节

  • 架构:专家混合,有 128 名专家,每个代币 8 名活跃专家
  • 上下文窗口:128K 令牌
  • 训练数据:15万亿代币的多语言数据
  • 语言:12种语言,包括英语、中文、西班牙语、法语等
  • 许可证:Llama 4 社区许可证(允许商业用途)

## 下一步是什么

元已经宣布: - Llama 4 多模式变体(视觉 + 音频)将于 2026 年第二季度推出 - 正在开发1T+参数模型 - 增强的微调工具包,支持 RLHF - Llama 4 针对移动部署进行了优化

## 总结

Llama 4 代表了迄今为止对专有人工智能模型最强大的开源挑战。 其 MoE 架构以极低的成本提供近乎前沿的性能,开放许可证确保全球开发人员和组织仍然可以使用人工智能功能。

MetaLlama 4Open SourceMoE

相关文章

掌握AI前沿动态

每周精选AI教程、工具推荐和行业资讯,直达您的邮箱。

加入 12,000+ 位AI开发者的行列