北京2025年4月7日 /美通社/ -- 亞馬遜云科技日前宣布,Meta的新一代Llama 4模型現(xiàn)已在Amazon SageMaker JumpStart上正式可用,完全托管的無服務器版本也將很快在Amazon Bedrock推出。首批推出的Llama 4 Scout 17B與Llama 4 Maverick 17B均具備先進的多模態(tài)能力(可同時理解圖像與文本),并擁有行業(yè)領先的上下文窗口長度(單次處理信息量),性能與效率較前代顯著提升。此外,Llama 4模型采用智能計算策略,根據(jù)具體任務智能選擇激活其"專家"模塊,而非全程調(diào)用全部算力,從而能以更低算力實現(xiàn)更優(yōu)效果,降低企業(yè)使用先進AI技術的使用門檻與成本。
亞馬遜云科技推出Llama 4 Scout與Llama 4 Maverick,進一步豐富了客戶在亞馬遜云科技上構建、部署和擴展應用程序時的模型選擇。亞馬遜云科技始終通過與如Meta等領先的AI公司緊密合作,確保客戶能在第一時間使用最新模型,并借助企業(yè)級的工具與安全保障更輕松地構建、定制和擴展其生成式AI應用。
亞馬遜云科技此次通過引入Meta兩款全新的多模態(tài)模型,進一步強化了其對模型多樣化的承諾。Llama 4 Scout 17B大幅擴展了AI單次處理能力——其上下文長度從早期Llama模型的12.8萬token躍升至1,000萬token(約提升80倍)。這一升級可支持多文檔總結、復雜用戶行為分析或整段代碼庫推理等場景。Llama 4 Maverick 17B是通用型模型,擅長12種語言的圖文理解任務,尤其適用于開發(fā)復雜的智能助手與聊天應用程序。
兩款Llama 4模型均采用原生多模態(tài)設計,即從設計之初就能無縫的同時理解文本與圖像,而非將兩者作為獨立的輸入進行處理。這是Meta首次采用高效的專家混合(MoE)架構,該架構僅針對每項任務激活模型中最相關的模塊,能夠幫助客戶顯著提升模型的訓練與推理的計算效率,進而以更低的成本獲得更出色的性能。
Llama 4 Scout 17B與Llama 4 Maverick 17B介紹
若將Llama 4模型擬人化,Scout就像一位注重細節(jié)的研究助理,擁有"過目不忘"的能力。假若身處大型圖書館中,它能夠僅憑一張小小的書桌,瞬間能從數(shù)千份文檔里精準調(diào)取所需信息。Scout能預判信息需求,不僅提供答案,還會賦予答案有意義的上下文。Maverick則像一位精通多語言的創(chuàng)意總監(jiān),擅長視覺敘事,無論是起草引人入勝的故事、精準分析復雜圖像,還是在客戶會議中用多種語言保持品牌聲調(diào),均能游刃有余。
數(shù)據(jù)解析
模型的專家混合(MoE)架構就像擁有一支專家團隊,而非一名通才。模型不會為每個問題調(diào)用全部算力,而是根據(jù)具體任務智能選擇激活其"專家"模塊。這類似于醫(yī)院將患者分診至不同??漆t(yī)生,而非讓每位醫(yī)生嘗試治療所有病癥。這種更具針對性的方式使Llama 4能以更少計算資源實現(xiàn)更強大的結果,讓各類規(guī)模的企業(yè)都能更便捷、經(jīng)濟地使用先進AI技術。對開發(fā)者而言,這意味著他們能夠構建復雜的應用程序,這些程序可以處理海量信息,同時支持多種語言,并能無縫處理文本和圖像。
亞馬遜云科技始終致力于為客戶及時提供領先AI公司最新模型,隨著模型在規(guī)模與模態(tài)上的持續(xù)擴展,這將賦能客戶充分釋放生成式AI的潛力。此外,亞馬遜云科技很快還將在Amazon Bedrock中推出完全托管的無服務器版本的Llama 4模型。
欲即刻使用Llama 4,請訪問Amazon SageMaker AI控制臺。