北京2025年4月7日 /美通社/ -- 亞馬遜云科技日前宣布,Meta的新一代Llama 4模型現(xiàn)已在Amazon SageMaker JumpStart上正式可用,完全托管的無服務(wù)器版本也將很快在Amazon Bedrock推出。首批推出的Llama 4 Scout 17B與Llama 4 Maverick 17B均具備先進(jìn)的多模態(tài)能力(可同時(shí)理解圖像與文本),并擁有行業(yè)領(lǐng)先的上下文窗口長度(單次處理信息量),性能與效率較前代顯著提升。此外,Llama 4模型采用智能計(jì)算策略,根據(jù)具體任務(wù)智能選擇激活其"專家"模塊,而非全程調(diào)用全部算力,從而能以更低算力實(shí)現(xiàn)更優(yōu)效果,降低企業(yè)使用先進(jìn)AI技術(shù)的使用門檻與成本。
亞馬遜云科技推出Llama 4 Scout與Llama 4 Maverick,進(jìn)一步豐富了客戶在亞馬遜云科技上構(gòu)建、部署和擴(kuò)展應(yīng)用程序時(shí)的模型選擇。亞馬遜云科技始終通過與如Meta等領(lǐng)先的AI公司緊密合作,確??蛻裟茉诘谝粫r(shí)間使用最新模型,并借助企業(yè)級(jí)的工具與安全保障更輕松地構(gòu)建、定制和擴(kuò)展其生成式AI應(yīng)用。
亞馬遜云科技此次通過引入Meta兩款全新的多模態(tài)模型,進(jìn)一步強(qiáng)化了其對模型多樣化的承諾。Llama 4 Scout 17B大幅擴(kuò)展了AI單次處理能力——其上下文長度從早期Llama模型的12.8萬token躍升至1,000萬token(約提升80倍)。這一升級(jí)可支持多文檔總結(jié)、復(fù)雜用戶行為分析或整段代碼庫推理等場景。Llama 4 Maverick 17B是通用型模型,擅長12種語言的圖文理解任務(wù),尤其適用于開發(fā)復(fù)雜的智能助手與聊天應(yīng)用程序。
兩款Llama 4模型均采用原生多模態(tài)設(shè)計(jì),即從設(shè)計(jì)之初就能無縫的同時(shí)理解文本與圖像,而非將兩者作為獨(dú)立的輸入進(jìn)行處理。這是Meta首次采用高效的專家混合(MoE)架構(gòu),該架構(gòu)僅針對每項(xiàng)任務(wù)激活模型中最相關(guān)的模塊,能夠幫助客戶顯著提升模型的訓(xùn)練與推理的計(jì)算效率,進(jìn)而以更低的成本獲得更出色的性能。
Llama 4 Scout 17B與Llama 4 Maverick 17B介紹
若將Llama 4模型擬人化,Scout就像一位注重細(xì)節(jié)的研究助理,擁有"過目不忘"的能力。假若身處大型圖書館中,它能夠僅憑一張小小的書桌,瞬間能從數(shù)千份文檔里精準(zhǔn)調(diào)取所需信息。Scout能預(yù)判信息需求,不僅提供答案,還會(huì)賦予答案有意義的上下文。Maverick則像一位精通多語言的創(chuàng)意總監(jiān),擅長視覺敘事,無論是起草引人入勝的故事、精準(zhǔn)分析復(fù)雜圖像,還是在客戶會(huì)議中用多種語言保持品牌聲調(diào),均能游刃有余。
數(shù)據(jù)解析
模型的專家混合(MoE)架構(gòu)就像擁有一支專家團(tuán)隊(duì),而非一名通才。模型不會(huì)為每個(gè)問題調(diào)用全部算力,而是根據(jù)具體任務(wù)智能選擇激活其"專家"模塊。這類似于醫(yī)院將患者分診至不同??漆t(yī)生,而非讓每位醫(yī)生嘗試治療所有病癥。這種更具針對性的方式使Llama 4能以更少計(jì)算資源實(shí)現(xiàn)更強(qiáng)大的結(jié)果,讓各類規(guī)模的企業(yè)都能更便捷、經(jīng)濟(jì)地使用先進(jìn)AI技術(shù)。對開發(fā)者而言,這意味著他們能夠構(gòu)建復(fù)雜的應(yīng)用程序,這些程序可以處理海量信息,同時(shí)支持多種語言,并能無縫處理文本和圖像。
亞馬遜云科技始終致力于為客戶及時(shí)提供領(lǐng)先AI公司最新模型,隨著模型在規(guī)模與模態(tài)上的持續(xù)擴(kuò)展,這將賦能客戶充分釋放生成式AI的潛力。此外,亞馬遜云科技很快還將在Amazon Bedrock中推出完全托管的無服務(wù)器版本的Llama 4模型。
欲即刻使用Llama 4,請?jiān)L問Amazon SageMaker AI控制臺(tái)。