Meta迄今最強AI模型Llama 4現(xiàn)已在亞馬遜云科技上正式可用

亞馬遜云科技

2025-04-07 14:21 710

北京2025年4月7日 /美通社/ -- 亞馬遜云科技日前宣布，Meta的新一代Llama 4模型現(xiàn)已在Amazon SageMaker JumpStart上正式可用，完全托管的無服務器版本也將很快在Amazon Bedrock推出。首批推出的Llama 4 Scout 17B與Llama 4 Maverick 17B均具備先進的多模態(tài)能力（可同時理解圖像與文本），并擁有行業(yè)領先的上下文窗口長度（單次處理信息量），性能與效率較前代顯著提升。此外，Llama 4模型采用智能計算策略，根據(jù)具體任務智能選擇激活其"專家"模塊，而非全程調(diào)用全部算力，從而能以更低算力實現(xiàn)更優(yōu)效果，降低企業(yè)使用先進AI技術的使用門檻與成本。

亞馬遜云科技推出Llama 4 Scout與Llama 4 Maverick，進一步豐富了客戶在亞馬遜云科技上構建、部署和擴展應用程序時的模型選擇。亞馬遜云科技始終通過與如Meta等領先的AI公司緊密合作，確保客戶能在第一時間使用最新模型，并借助企業(yè)級的工具與安全保障更輕松地構建、定制和擴展其生成式AI應用。

亞馬遜云科技此次通過引入Meta兩款全新的多模態(tài)模型，進一步強化了其對模型多樣化的承諾。Llama 4 Scout 17B大幅擴展了AI單次處理能力——其上下文長度從早期Llama模型的12.8萬token躍升至1,000萬token（約提升80倍）。這一升級可支持多文檔總結、復雜用戶行為分析或整段代碼庫推理等場景。Llama 4 Maverick 17B是通用型模型，擅長12種語言的圖文理解任務，尤其適用于開發(fā)復雜的智能助手與聊天應用程序。

兩款Llama 4模型均采用原生多模態(tài)設計，即從設計之初就能無縫的同時理解文本與圖像，而非將兩者作為獨立的輸入進行處理。這是Meta首次采用高效的專家混合（MoE）架構，該架構僅針對每項任務激活模型中最相關的模塊，能夠幫助客戶顯著提升模型的訓練與推理的計算效率，進而以更低的成本獲得更出色的性能。

Llama 4 Scout 17B與Llama 4 Maverick 17B介紹

若將Llama 4模型擬人化，Scout就像一位注重細節(jié)的研究助理，擁有"過目不忘"的能力。假若身處大型圖書館中，它能夠僅憑一張小小的書桌，瞬間能從數(shù)千份文檔里精準調(diào)取所需信息。Scout能預判信息需求，不僅提供答案，還會賦予答案有意義的上下文。Maverick則像一位精通多語言的創(chuàng)意總監(jiān)，擅長視覺敘事，無論是起草引人入勝的故事、精準分析復雜圖像，還是在客戶會議中用多種語言保持品牌聲調(diào)，均能游刃有余。

數(shù)據(jù)解析

據(jù)Meta稱，Llama 4 Scout 17B包含170億活躍參數(shù)與1,090億總參數(shù)，其性能在同類別模型中處于領先水平。
Llama 4 Scout 17B還擁有行業(yè)領先的1,000萬token上下文窗口——約為Llama 3的12.8萬token的80倍。這相當于從一次性吸收幾頁書的信息躍升至整部百科全書。
Llama 4 Maverick 17B包含170億活躍參數(shù)與4,000億總參數(shù)，分布于128個專家模塊中。這如同擁有128臺協(xié)同工作的專用機器，但僅按任務激活最相關的部分，兼具強大性能與效率。

模型的專家混合（MoE）架構就像擁有一支專家團隊，而非一名通才。模型不會為每個問題調(diào)用全部算力，而是根據(jù)具體任務智能選擇激活其"專家"模塊。這類似于醫(yī)院將患者分診至不同?？漆t(yī)生，而非讓每位醫(yī)生嘗試治療所有病癥。這種更具針對性的方式使Llama 4能以更少計算資源實現(xiàn)更強大的結果，讓各類規(guī)模的企業(yè)都能更便捷、經(jīng)濟地使用先進AI技術。對開發(fā)者而言，這意味著他們能夠構建復雜的應用程序，這些程序可以處理海量信息，同時支持多種語言，并能無縫處理文本和圖像。

亞馬遜云科技始終致力于為客戶及時提供領先AI公司最新模型，隨著模型在規(guī)模與模態(tài)上的持續(xù)擴展，這將賦能客戶充分釋放生成式AI的潛力。此外，亞馬遜云科技很快還將在Amazon Bedrock中推出完全托管的無服務器版本的Llama 4模型。

欲即刻使用Llama 4，請訪問Amazon SageMaker AI控制臺。

消息來源：亞馬遜云科技