資訊

Meta 開源 Llama 4 — 適合所有人的 400B 引數模型

Meta 透過 Llama 4 繼續其開源使命,採用 400B MoE 架構,可以以極低的成本與專有模型相媲美。

AIcloud2026-02-035 分鐘閱讀

發生了什麼

Meta 釋出了 Llama 4,這是迄今為止功能最強大的開源模型。 旗艦模型採用混合專家 (MoE) 架構,總引數為 400B,但每次推理僅啟用 52B 引數,實現與專有模型相當的效能,同時保持執行效率。

Llama 4 系列包括:

  • Llama 4 Scout (8B):用於邊緣裝置和快速推理的輕量級模型
  • Llama 4 Maverick (70B):強大的通用模型
  • Llama 4 Behemoth (400B MoE):與專有產品相媲美的旗艦型號

## 為什麼它很重要

### 人工智慧民主化 Llama 4 延續了 Meta 的承諾,即讓每個人都能使用最先進的人工智慧。 開放重量許可證允許:

  • 商業用途無需許可費
  • 針對特定領域的微調
  • 自託管部署以保護資料隱私
  • 社羣驅動的改進和擴充套件

### 效能與成本 MoE 架構提供了卓越的效能成本比:

__程式碼_塊_0__

雖然與頂級專有模型不完全匹配,但 Llama 4 Behemoth 在自託管時的成本卻非常接近。

基礎設施生態系統

主要雲提供商已經宣佈支援 Llama 4:

  • AWS:可在 SageMaker 和 Bedrock 上使用
  • Azure:可在 Azure AI 上使用
  • Google Cloud:可在 Vertex AI 上使用
  • Together AI:最佳化推理 API
  • Ollama:本地部署支援

## 關鍵技術細節

  • 架構:專家混合,有 128 名專家,每個代幣 8 名活躍專家
  • 上下文視窗:128K 令牌
  • 訓練資料:15萬億代幣的多語言資料
  • 語言:12種語言,包括英語、中文、西班牙語、法語等
  • 許可證:Llama 4 社羣許可證(允許商業用途)

## 下一步是什麼

元已經宣佈: - Llama 4 多模式變體(視覺 + 音訊)將於 2026 年第二季度推出 - 正在開發1T+引數模型 - 增強的微調工具包,支援 RLHF - Llama 4 針對移動部署進行了最佳化

## 總結

Llama 4 代表了迄今為止對專有人工智慧模型最強大的開源挑戰。 其 MoE 架構以極低的成本提供近乎前沿的效能,開放許可證確保全球開發人員和組織仍然可以使用人工智慧功能。

MetaLlama 4Open SourceMoE

相關文章

掌握AI前沿動態

每週精選AI教程、工具推薦和行業資訊,直達您的郵箱。

加入 12,000+ 位AI開發者的行列