您的位置 首页 通讯

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta 今日发布了首批 Llama 4 系列模型:Llama 4 Scout 和 Llama 4 Maverick。 据报道,此前 DeepSeek 发布的开源模型(如 R1 和 V3)在性能上与 Meta 之前的旗舰 Llama 模型相当甚至更优,促使 Meta 加快了 Llama 4 的研发节奏。为应对竞争,Meta 内部曾设立“作战室”以深入研究 DS 如何实现更低成本的模型部署与运行。如今,Llama 4 与 V3 在性能上的对比依然是业内关注的焦点。 Meta GenAI负责人在X上表示,本次发布标志着 Llama 系列的全面重构完成。他表示,此次推出的是 Llama 4 系列中首批开源模型,代表了该系列发展的又一重要里程碑。本次发布的主要亮点有: 📌 Llama 4 系列在架构层面进行了全面升级,采用先进的专家混合(MoE,Mixture-of-Experts)架构,并在原生多模态任务上进行了联合训练。此次发布包括 Llama 4 Scout 和 Llama 4 Maverick,同时也首次预览了更强大的 Llama 4 Behemoth。 📌 Llama 4 Scout 是目前性能最强的小型模型,拥有 170 亿活跃参数和 16 个专家模块。该模型具备出色的推理速度,原生支持多模态,具备强大的智能能力,支持业界领先的 1000 万以上 token 上下文窗口,并且可在单张 GPU 上运行。 📌 Llama 4 Maverick 是当前同类中最强的多模态模型,在多个公开评测中超越 GPT-4o 和 Gemini 2.0 Flash,在推理和编程任务上与 DeepSeek v3 表现相当,同时活跃参数不到其一半。该模型在性能与成本比方面表现出色,其实验性对话版本在 LMArena 榜单中获得 1417 的 ELO 分数,并且也可在单机环境中运行。 📌 Meta 还预览了 Llama 4 系列中性能最强的模型 —— Llama 4 Behemoth,该模型在多个 STEM 基准测试中超过 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 目前仍在训练中,Meta 表示将持续披露其更多细节。

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

展开全文

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta开源Llama 4,正面迎战 DeepSeek!经过重新设计,首次采用MoE

Meta 今日发布了首批 Llama 4 系列模型:Llama 4 Scout 和 Llama 4 Maverick。 据报道,此前 DeepSeek 发布的开源模型(如 R1 和 V3)在性能上与 Meta 之前的旗舰 Llama 模型相当甚至更优,促使 Meta 加快了 Llama 4 的研发节奏。为应对竞争,Meta 内部曾设立“作战室”以深入研究 DS 如何实现更低成本的模型部署与运行。如今,Llama 4 与 V3 在性能上的对比依然是业内关注的焦点。 Meta GenAI负责人在X上表示,本次发布标志着 Llama 系列的全面重构完成。他表示,此次推出的是 Llama 4 系列中首批开源模型,代表了该系列发展的又一重要里程碑。本次发布的主要亮点有: 📌 Llama 4 系列在架构层面进行了全面升级,采用先进的专家混合(MoE,Mixture-of-Experts)架构,并在原生多模态任务上进行了联合训练。此次发布包括 Llama 4 Scout 和 Llama 4 Maverick,同时也首次预览了更强大的 Llama 4 Behemoth。 📌 Llama 4 Scout 是目前性能最强的小型模型,拥有 170 亿活跃参数和 16 个专家模块。该模型具备出色的推理速度,原生支持多模态,具备强大的智能能力,支持业界领先的 1000 万以上 token 上下文窗口,并且可在单张 GPU 上运行。 📌 Llama 4 Maverick 是当前同类中最强的多模态模型,在多个公开评测中超越 GPT-4o 和 Gemini 2.0 Flash,在推理和编程任务上与 DeepSeek v3 表现相当,同时活跃参数不到其一半。该模型在性能与成本比方面表现出色,其实验性对话版本在 LMArena 榜单中获得 1417 的 ELO 分数,并且也可在单机环境中运行。 📌 Meta 还预览了 Llama 4 系列中性能最强的模型 —— Llama 4 Behemoth,该模型在多个 STEM 基准测试中超过 GPT-4.5、Claude Sonnet 3.7 和 Gemini 2.0 Pro。Llama 4 Behemoth 目前仍在训练中,Meta 表示将持续披露其更多细节。

本文来自网络,不代表冰河马新闻网立场,转载请注明出处:http://lcvt.cn/22098.html

作者: wczz1314

为您推荐

发表回复

您的邮箱地址不会被公开。 必填项已用 * 标注

联系我们

联系我们

13000001211

在线咨询: QQ交谈

邮箱: email@wangzhan.com

关注微信
微信扫一扫关注我们

微信扫一扫关注我们

关注微博
返回顶部