Meta迄今最強(qiáng)AI模型Llama 4現(xiàn)已在亞馬遜云科技上正式可用

亞馬遜云科技

2025-04-07 14:21 610

北京2025年4月7日 /美通社/ -- 亞馬遜云科技日前宣布，Meta的新一代Llama 4模型現(xiàn)已在Amazon SageMaker JumpStart上正式可用，完全托管的無服務(wù)器版本也將很快在Amazon Bedrock推出。首批推出的Llama 4 Scout 17B與Llama 4 Maverick 17B均具備先進(jìn)的多模態(tài)能力（可同時(shí)理解圖像與文本），并擁有行業(yè)領(lǐng)先的上下文窗口長度（單次處理信息量），性能與效率較前代顯著提升。此外，Llama 4模型采用智能計(jì)算策略，根據(jù)具體任務(wù)智能選擇激活其"專家"模塊，而非全程調(diào)用全部算力，從而能以更低算力實(shí)現(xiàn)更優(yōu)效果，降低企業(yè)使用先進(jìn)AI技術(shù)的使用門檻與成本。

亞馬遜云科技推出Llama 4 Scout與Llama 4 Maverick，進(jìn)一步豐富了客戶在亞馬遜云科技上構(gòu)建、部署和擴(kuò)展應(yīng)用程序時(shí)的模型選擇。亞馬遜云科技始終通過與如Meta等領(lǐng)先的AI公司緊密合作，確?？蛻裟茉诘谝粫r(shí)間使用最新模型，并借助企業(yè)級(jí)的工具與安全保障更輕松地構(gòu)建、定制和擴(kuò)展其生成式AI應(yīng)用。

亞馬遜云科技此次通過引入Meta兩款全新的多模態(tài)模型，進(jìn)一步強(qiáng)化了其對模型多樣化的承諾。Llama 4 Scout 17B大幅擴(kuò)展了AI單次處理能力——其上下文長度從早期Llama模型的12.8萬token躍升至1,000萬token（約提升80倍）。這一升級(jí)可支持多文檔總結(jié)、復(fù)雜用戶行為分析或整段代碼庫推理等場景。Llama 4 Maverick 17B是通用型模型，擅長12種語言的圖文理解任務(wù)，尤其適用于開發(fā)復(fù)雜的智能助手與聊天應(yīng)用程序。

兩款Llama 4模型均采用原生多模態(tài)設(shè)計(jì)，即從設(shè)計(jì)之初就能無縫的同時(shí)理解文本與圖像，而非將兩者作為獨(dú)立的輸入進(jìn)行處理。這是Meta首次采用高效的專家混合（MoE）架構(gòu)，該架構(gòu)僅針對每項(xiàng)任務(wù)激活模型中最相關(guān)的模塊，能夠幫助客戶顯著提升模型的訓(xùn)練與推理的計(jì)算效率，進(jìn)而以更低的成本獲得更出色的性能。

Llama 4 Scout 17B與Llama 4 Maverick 17B介紹

若將Llama 4模型擬人化，Scout就像一位注重細(xì)節(jié)的研究助理，擁有"過目不忘"的能力。假若身處大型圖書館中，它能夠僅憑一張小小的書桌，瞬間能從數(shù)千份文檔里精準(zhǔn)調(diào)取所需信息。Scout能預(yù)判信息需求，不僅提供答案，還會(huì)賦予答案有意義的上下文。Maverick則像一位精通多語言的創(chuàng)意總監(jiān)，擅長視覺敘事，無論是起草引人入勝的故事、精準(zhǔn)分析復(fù)雜圖像，還是在客戶會(huì)議中用多種語言保持品牌聲調(diào)，均能游刃有余。

數(shù)據(jù)解析

據(jù)Meta稱，Llama 4 Scout 17B包含170億活躍參數(shù)與1,090億總參數(shù)，其性能在同類別模型中處于領(lǐng)先水平。
Llama 4 Scout 17B還擁有行業(yè)領(lǐng)先的1,000萬token上下文窗口——約為Llama 3的12.8萬token的80倍。這相當(dāng)于從一次性吸收幾頁書的信息躍升至整部百科全書。
Llama 4 Maverick 17B包含170億活躍參數(shù)與4,000億總參數(shù)，分布于128個(gè)專家模塊中。這如同擁有128臺(tái)協(xié)同工作的專用機(jī)器，但僅按任務(wù)激活最相關(guān)的部分，兼具強(qiáng)大性能與效率。

模型的專家混合（MoE）架構(gòu)就像擁有一支專家團(tuán)隊(duì)，而非一名通才。模型不會(huì)為每個(gè)問題調(diào)用全部算力，而是根據(jù)具體任務(wù)智能選擇激活其"專家"模塊。這類似于醫(yī)院將患者分診至不同?？漆t(yī)生，而非讓每位醫(yī)生嘗試治療所有病癥。這種更具針對性的方式使Llama 4能以更少計(jì)算資源實(shí)現(xiàn)更強(qiáng)大的結(jié)果，讓各類規(guī)模的企業(yè)都能更便捷、經(jīng)濟(jì)地使用先進(jìn)AI技術(shù)。對開發(fā)者而言，這意味著他們能夠構(gòu)建復(fù)雜的應(yīng)用程序，這些程序可以處理海量信息，同時(shí)支持多種語言，并能無縫處理文本和圖像。

亞馬遜云科技始終致力于為客戶及時(shí)提供領(lǐng)先AI公司最新模型，隨著模型在規(guī)模與模態(tài)上的持續(xù)擴(kuò)展，這將賦能客戶充分釋放生成式AI的潛力。此外，亞馬遜云科技很快還將在Amazon Bedrock中推出完全托管的無服務(wù)器版本的Llama 4模型。

欲即刻使用Llama 4，請?jiān)L問Amazon SageMaker AI控制臺(tái)。

消息來源：亞馬遜云科技