发生了什么
Meta 发布了 Llama 4,这是迄今为止功能最强大的开源模型。 旗舰模型采用混合专家 (MoE) 架构,总参数为 400B,但每次推理仅激活 52B 参数,实现与专有模型相当的性能,同时保持运行效率。
Llama 4 系列包括:
- Llama 4 Scout (8B):用于边缘设备和快速推理的轻量级模型
- Llama 4 Maverick (70B):强大的通用模型
- Llama 4 Behemoth (400B MoE):与专有产品相媲美的旗舰型号
## 为什么它很重要
### 人工智能民主化 Llama 4 延续了 Meta 的承诺,即让每个人都能使用最先进的人工智能。 开放重量许可证允许:
- 商业用途无需许可费
- 针对特定领域的微调
- 自托管部署以保护数据隐私
- 社区驱动的改进和扩展
### 性能与成本 MoE 架构提供了卓越的性能成本比:
__代码_块_0__
虽然与顶级专有模型不完全匹配,但 Llama 4 Behemoth 在自托管时的成本却非常接近。
基础设施生态系统
主要云提供商已经宣布支持 Llama 4:
- AWS:可在 SageMaker 和 Bedrock 上使用
- Azure:可在 Azure AI 上使用
- Google Cloud:可在 Vertex AI 上使用
- Together AI:优化推理 API
- Ollama:本地部署支持
## 关键技术细节
- 架构:专家混合,有 128 名专家,每个代币 8 名活跃专家
- 上下文窗口:128K 令牌
- 训练数据:15万亿代币的多语言数据
- 语言:12种语言,包括英语、中文、西班牙语、法语等
- 许可证:Llama 4 社区许可证(允许商业用途)
## 下一步是什么
元已经宣布: - Llama 4 多模式变体(视觉 + 音频)将于 2026 年第二季度推出 - 正在开发1T+参数模型 - 增强的微调工具包,支持 RLHF - Llama 4 针对移动部署进行了优化
## 总结
Llama 4 代表了迄今为止对专有人工智能模型最强大的开源挑战。 其 MoE 架构以极低的成本提供近乎前沿的性能,开放许可证确保全球开发人员和组织仍然可以使用人工智能功能。