亞馬遜推出新一代基礎(chǔ)模型Amazon Nova

亞馬遜云科技

2024-12-04 16:47 3046

亞馬遜的新一代基礎(chǔ)模型提供前沿智能和行業(yè)領(lǐng)先的性價(jià)比
Amazon Nova模型擴(kuò)展了Amazon Bedrock中針對(duì)企業(yè)客戶提供的豐富且強(qiáng)大的基礎(chǔ)模型選擇

北京2024年12月4日 /美通社/ -- 亞馬遜在2024 re:Invent全球大會(huì)上，宣布推出新一代基礎(chǔ)模型Amazon Nova，這些模型在多種任務(wù)上展現(xiàn)出優(yōu)秀智能，且具備行業(yè)領(lǐng)先的性價(jià)比。Amazon Nova模型將在Amazon Bedrock中提供，包括超快速文本生成模型Amazon Nova Micro，以及能夠處理文本、圖像和視頻并生成文本的多模態(tài)模型Amazon Nova Lite、Amazon Nova Pro和Amazon Nova Premier。此外，亞馬遜還推出了兩個(gè)全新模型——用于生成高質(zhì)量圖像的Amazon Nova Canvas和用于生成高質(zhì)量視頻的Amazon Nova Reel。

亞馬遜通用人工智能高級(jí)副總裁Rohit Prasad表示："在亞馬遜內(nèi)部，我們約1000個(gè)生成式AI應(yīng)用正在進(jìn)行中，因此可以全面了解開發(fā)者所面臨的挑戰(zhàn)。我們的新一代Amazon Nova模型旨在幫助內(nèi)外部開發(fā)者應(yīng)對(duì)這些挑戰(zhàn)，提供強(qiáng)大的智能和內(nèi)容生成功能，并在延遲、成本效益、定制化、檢索增強(qiáng)生成（RAG）和智能體能力等方面取得顯著進(jìn)展。"

Amazon Nova理解模型展現(xiàn)出卓越的智能、能力與速度

Amazon Nova包含四款先進(jìn)的模型。Amazon Nova Micro是一款僅處理文本的模型，能夠以極低的延遲和成本提供響應(yīng)。Amazon Nova Lite是一款極具成本效益的多模態(tài)模型，能夠快速處理圖像、視頻和文本輸入；Amazon Nova Pro是一款功能強(qiáng)大的多模態(tài)模型，可在準(zhǔn)確性、速度和成本之間實(shí)現(xiàn)絕佳平衡，適合多種任務(wù)；Amazon Nova Premier是亞馬遜的頂級(jí)多模態(tài)模型，專為復(fù)雜推理任務(wù)而生，并可用于作為"教師模型"來蒸餾定制模型。目前，Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro已全部正式可用，Amazon Nova Premier預(yù)計(jì)將在2025年第一季度可用。

亞馬遜對(duì)Amazon Nova模型進(jìn)行了廣泛的行業(yè)基準(zhǔn)測試。結(jié)果表明，Amazon Nova Micro、Amazon Nova Lite和Amazon Nova Pro在各自類別中與最佳模型相比均表現(xiàn)得相當(dāng)有競爭力。

Amazon Nova Micro在所有11項(xiàng)適用基準(zhǔn)測試中，其表現(xiàn)與Meta的LLaMa 3.1 8B相當(dāng)或更優(yōu)，而在所有12項(xiàng)適用基準(zhǔn)測試中，其表現(xiàn)也與Google Gemini 1.5 Flash-8B持平或更優(yōu)。憑借每秒210個(gè)輸出token的行業(yè)領(lǐng)先速度，Amazon Nova Micro非常適合需要快速響應(yīng)的應(yīng)用場景。

Amazon Nova Lite在同類模型中同樣具備強(qiáng)勁競爭力。與OpenAI的GPT-4o mini相比，它在19項(xiàng)基準(zhǔn)測試中有17項(xiàng)表現(xiàn)持平或更優(yōu)，與Google的Gemini 1.5 Flash-8B相比，在21項(xiàng)基準(zhǔn)測試中也有17項(xiàng)表現(xiàn)相當(dāng)或更優(yōu)，與Anthropic的Claude Haiku 3.5相比，則在12項(xiàng)基準(zhǔn)測試中有10項(xiàng)表現(xiàn)相當(dāng)或更優(yōu)。除了在文本基準(zhǔn)測試中展現(xiàn)出色的準(zhǔn)確性外，Amazon Nova Lite在視頻、圖表和文檔理解方面也表現(xiàn)突出，這一點(diǎn)通過VATEX、ChartQA和DocVQA等基準(zhǔn)測試得到了證明。此外，Amazon Nova Lite在智能體工作流上也表現(xiàn)優(yōu)異，如在Berkeley Function Calling Leaderboard（伯克利函數(shù)調(diào)用排行榜）上的函數(shù)調(diào)用能力，以及在理解視覺元素以在瀏覽器和計(jì)算機(jī)屏幕上執(zhí)行操作的核心能力方面表現(xiàn)出色，這一點(diǎn)在VisualWebBench（網(wǎng)頁瀏覽器操作基準(zhǔn)測試）和Mind2Web（通用多模態(tài)代理基準(zhǔn)測試）得到證明。

Amazon Nova Pro在與OpenAI的GPT-4o的20項(xiàng)基準(zhǔn)測試中，有17項(xiàng)表現(xiàn)相當(dāng)或更優(yōu)；在與Google的Gemini 1.5 Pro的21項(xiàng)基準(zhǔn)測試中，有16項(xiàng)表現(xiàn)持平或更優(yōu)；在與Anthropic的Claude Sonnet 3.5v2的20項(xiàng)基準(zhǔn)測試中，有9項(xiàng)表現(xiàn)相當(dāng)或更優(yōu)。除了在文本和視覺智能基準(zhǔn)測試中的準(zhǔn)確性外，Amazon Nova Pro在遵循指令和多模態(tài)智能體工作流方面也表現(xiàn)出色，相關(guān)測評(píng)包括綜合RAG（CRAG）、Berkeley Function Calling Leaderboard（伯克利函數(shù)調(diào)用排行榜）和Mind2Web。

多語言和多模態(tài)支持，具備長上下文處理能力

Amazon Nova Micro、Lite和Pro支持200多種語言。Amazon Nova Micro支持128K輸入token的上下文長度，而Amazon Nova Lite和Pro的上下文長度可達(dá)300K token，處理視頻時(shí)長可達(dá)30分鐘。到2025年初，Amazon將支持超過200萬輸入token的上下文長度。

快速且具有成本效益

Amazon Nova模型快速，具有成本效益，且設(shè)計(jì)上易于與客戶的系統(tǒng)和數(shù)據(jù)無縫集成。Amazon Nova Micro、Lite和Pro在各自智能類別中，成本比Amazon Bedrock中表現(xiàn)最佳的模型至少便宜75%，同時(shí)也是Amazon Bedrock中對(duì)應(yīng)類別速度最快的模型。

與Amazon Bedrock的無縫集成

所有Amazon Nova模型均已與Amazon Bedrock集成。Amazon Bedrock是一個(gè)完全托管的服務(wù)，通過單一API提供來自領(lǐng)先AI公司的高性能模型?？蛻艨梢暂p松試用和評(píng)估Amazon Nova模型及其他模型，找到最適合其應(yīng)用的模型。

支持微調(diào)以提升準(zhǔn)確性

這些模型還支持自定義微調(diào)，允許客戶根據(jù)自身專有數(shù)據(jù)中的已標(biāo)記示例來提升準(zhǔn)確性。Amazon Nova模型能夠從客戶的數(shù)據(jù)（包括文本、圖像和視頻）中學(xué)習(xí)最重要的信息，隨后Amazon Bedrock會(huì)訓(xùn)練一個(gè)私有的微調(diào)模型，以提供定制化響應(yīng)。

蒸餾用于訓(xùn)練更小、更高效的模型

除了支持微調(diào)外，這些模型還支持蒸餾，可以將規(guī)模更大、實(shí)力更強(qiáng)的"教師模型"中的特定知識(shí)轉(zhuǎn)移到更小的模型上，從而實(shí)現(xiàn)更高的精確度、更快的響應(yīng)速度以及更低的運(yùn)營成本。

基于數(shù)據(jù)響應(yīng)的檢索增強(qiáng)生成（RAG）

Amazon Nova模型與Amazon Bedrock知識(shí)庫緊密集成，專注于檢索增強(qiáng)生成（RAG）方法，使客戶能夠通過利用自身的數(shù)據(jù)確保生成內(nèi)容的高度準(zhǔn)確性和相關(guān)性。

針對(duì)智能體應(yīng)用進(jìn)行優(yōu)化

Amazon Nova模型經(jīng)過優(yōu)化，便于智能體應(yīng)用在執(zhí)行多步驟任務(wù)時(shí)通過多個(gè)API與企業(yè)的專有系統(tǒng)和數(shù)據(jù)進(jìn)行交互。

借助Nova創(chuàng)意內(nèi)容生成模型，訪問生產(chǎn)級(jí)視覺內(nèi)容

Amazon Nova Canvas是一款先進(jìn)的圖像生成模型，能夠根據(jù)輸入的文本或圖像生成專業(yè)級(jí)的視覺內(nèi)容。它提供了便捷的編輯功能，用戶可以通過文本輕松調(diào)整圖像，控制顏色方案和布局。該模型內(nèi)置的安全控制措施確保AI的安全和負(fù)責(zé)任使用，包括水印功能，能夠追溯每張圖像的來源；以及內(nèi)容審核功能，限制可能產(chǎn)生的有害內(nèi)容。根據(jù)第三方的對(duì)比評(píng)估，Amazon Nova Canvas在性能上優(yōu)于OpenAI的DALL-E 3和Stable Diffusion，并在關(guān)鍵的自動(dòng)化指標(biāo)上表現(xiàn)出色。

Amazon Nova Reel是一款先進(jìn)的視頻生成模型，能夠幫助客戶輕松從文本和圖像創(chuàng)建高質(zhì)量視頻，適用于廣告、營銷和培訓(xùn)等內(nèi)容創(chuàng)作。客戶可以使用自然語言提示控制視覺風(fēng)格和節(jié)奏，包括相機(jī)運(yùn)動(dòng)、旋轉(zhuǎn)和縮放。根據(jù)第三方的評(píng)估，Amazon Nova Reel在質(zhì)量和一致性上優(yōu)于同類模型，客戶更傾向于選擇由其生成的視頻，而非Runway的Gen-3 Alpha生成的視頻。與Amazon Nova Canvas一樣，Amazon Nova Reel也具備內(nèi)置的安全控制措施，包括水印和內(nèi)容審核。目前，Amazon Nova Reel支持生成六秒的視頻，未來幾個(gè)月將支持最長為兩分鐘的視頻生成。

下一步計(jì)劃：語音到語音和多模態(tài)到多模態(tài)模型

亞馬遜計(jì)劃在2025年第一季度推出Amazon Nova語音到語音模型。該模型旨在通過理解自然語言的流式語音輸入，解釋語言和非語言信號(hào)（如語調(diào)和節(jié)奏），提供流暢的類人交互，徹底改變對(duì)話式AI應(yīng)用，確保低延遲的雙向交流。

此外，Amazon還在開發(fā)一種新模型，能夠接受文本、圖像、音頻和視頻作為輸入，并以任意模態(tài)生成輸出。這款具備本地多模態(tài)到多模態(tài)——即"任意到任意"模態(tài)能力的Amazon Nova模型預(yù)計(jì)將在2025年中旬推出。該模型將簡化應(yīng)用開發(fā)，使同一模型能夠執(zhí)行多種任務(wù)，如內(nèi)容模態(tài)轉(zhuǎn)換、內(nèi)容編輯，以及驅(qū)動(dòng)能夠理解和生成所有模態(tài)的AI代理。

亞馬遜云科技的合作伙伴和客戶已開始使用Amazon Nova模型，從其強(qiáng)大功能和超高性價(jià)比中獲益

亞馬遜云科技的戰(zhàn)略合作伙伴SAP正在將Amazon Nova模型集成到SAP AI Core生成式AI中心支持的大語言模型（LLMs）家族中。這一舉措使開發(fā)者能夠?yàn)镾AP的AI助手Joule創(chuàng)建新技能，并利用SAP數(shù)據(jù)中完整的業(yè)務(wù)上下文，安全地構(gòu)建AI驅(qū)動(dòng)的解決方案，從而實(shí)現(xiàn)自動(dòng)化、個(gè)性化以及供應(yīng)鏈規(guī)劃等高級(jí)功能。

德勤作為亞馬遜云科技的戰(zhàn)略合作伙伴，致力于為全球各行業(yè)提供一流的生成式AI服務(wù)。德勤深知，沒有一種AI解決方案和基礎(chǔ)模型能解決所有問題，認(rèn)為Amazon Nova模型的高級(jí)定制能力和增強(qiáng)安全性將推動(dòng)創(chuàng)新，為全球客戶帶來卓越的價(jià)值。

Amazon致力于開發(fā)負(fù)責(zé)任的人工智能

Amazon Nova模型內(nèi)置安全和保護(hù)措施。亞馬遜還推出了Amazon AI服務(wù)卡，提供有關(guān)使用場景、局限性和負(fù)責(zé)任AI實(shí)踐的透明信息。

消息來源：亞馬遜云科技