Palmyra X5 是專為高效驅(qū)動多步驟 agents 而開發(fā)的模型,現(xiàn)僅可通過 Writer 和 Amazon Bedrock 以完全托管的方式提供。
北京 2025年4月29日 /美通社/ -- 亞馬遜云科技宣布,在Amazon Bedrock上正式推出Palmyra X5——這是一款全新的具備一百萬token上下文窗口的自適應(yīng)推理模型。該模型由企業(yè)級生成式AI領(lǐng)軍企業(yè)Writer發(fā)布,是首批在Amazon Bedrock提供如此大規(guī)模上下文窗口的模型之一。該模型在速度和成本效率方面進行了優(yōu)化,使客戶能夠構(gòu)建先進的多步驟AI agents,并能精確處理海量企業(yè)數(shù)據(jù),從根本上改變了推理方式。亞馬遜云科技現(xiàn)已成為首家且目前唯一提供Writer完全托管、無服務(wù)器模型的云提供商,包括最新Palmyra X5及Palmyra X4,其他更多模型也將很快上線。
隨著生成式AI技術(shù)的加速發(fā)展,客戶需要廣泛的模型選擇以精準(zhǔn)匹配業(yè)務(wù)需求。Writer模型在Amazon Bedrock的推出,進一步豐富了Amazon Bedrock廣泛的完全托管模型的選擇,這些模型均來自領(lǐng)先的AI企業(yè),幫助客戶能更輕松、安全地構(gòu)建和擴展生成式AI應(yīng)用,推動業(yè)務(wù)轉(zhuǎn)型與創(chuàng)新。
Palmyra X5是首批在Amazon Bedrock提供一百萬token上下文窗口的模型之一,為亞馬遜云科技的客戶提供更多選擇(上下文窗口指一個模型每次輸入/請求能處理和"記憶"的信息量。它以模型處理的最小文本單位token為計量單位,可視為模型的"短期記憶")。憑借這種規(guī)模的上下文窗口,Palmyra可精準(zhǔn)處理1500頁內(nèi)容(相當(dāng)于6本書)。該模型還是業(yè)界首批企業(yè)級自適應(yīng)推理模型之一,并兼具先進的大語言模型能力以及擴展的記憶、處理能力。企業(yè)現(xiàn)可在預(yù)算范圍內(nèi)處理廣泛任務(wù),包括財務(wù)報告、法律合同分析、醫(yī)療記錄整合、客戶反饋挖掘等。
除推理能力外,Palmyra X5 還具有多項強大功能,能夠支持與系統(tǒng)交互的agents、支持高級代碼生成與部署,并支持超過30種語言。
Palmyra X5 介紹:
若將Palmyra X5模型擬人化,它就像具有超能力——可在22秒內(nèi)讀完一百萬個單詞的內(nèi)容,并即時生成可執(zhí)行的見解。它不僅能完整記憶200頁戰(zhàn)略文檔的全部內(nèi)容,更能理解其與昨天的客戶會議、上個季度財務(wù)數(shù)據(jù)的內(nèi)在關(guān)聯(lián)。面對復(fù)雜的問題時,它能系統(tǒng)化地逐步推進解決方案,全程清晰闡述思考路徑——無論是幫助分析海量客戶反饋以提煉共性,還是排查技術(shù)故障。
Writer 首席技術(shù)官兼聯(lián)合創(chuàng)始人 Waseem AlShikh 表示:"我們選擇亞馬遜云科技作為首家提供Writer完全托管模型的主流云服務(wù)提供商,源于其無與倫比的安全性,以及雙方在變革企業(yè)AI應(yīng)用方式、驅(qū)動創(chuàng)新增長愿景上的高度契合。Palmyra X5是Writer迄今最先進的模型,它能高速處理海量企業(yè)數(shù)據(jù),這對于擴展多代理系統(tǒng)(multi-agent systems)至關(guān)重要。通過Amazon Bedrock,我們將這些強大功能帶給全球更多企業(yè),幫助客戶在安全、可擴展的環(huán)境中部署。"
亞馬遜云科技 Amazon Bedrock 總監(jiān) Atul Deo 表示:"基于與Writer的深度戰(zhàn)略合作,我們很高興通過Amazon Bedrock提供Writer的Palmyra系列模型,賦能企業(yè)開啟智能Agent創(chuàng)新的新時代。Palmyra X5在長上下文窗口中提供卓越性能,兼具企業(yè)級可靠性與速度。無縫接入Writer的Palmyra X5將讓開發(fā)者和企業(yè)利用亞馬遜云科技的安全性、擴展性和性能,構(gòu)建和擴展AI agents,實現(xiàn)海量企業(yè)數(shù)據(jù)推理范式的革新。"
數(shù)據(jù)解析:
盡管生成式AI正在改變我們創(chuàng)建、分析和交互信息的方式,但Agentic AI將從根本上重塑工作本質(zhì)。AI的這一新前沿超越了內(nèi)容生成與洞察提煉,轉(zhuǎn)向能夠自主規(guī)劃、執(zhí)行和調(diào)整復(fù)雜動作序列的AI agents。通過Amazon Bedrock提供的Palmyra X5,亞馬遜云科技的客戶可使用Writer的模型安全私密地構(gòu)建和擴展AI agents,無需管理底層基礎(chǔ)設(shè)施。此外,對各行業(yè)的企業(yè)來說,Palmyra X5最令人振奮的是能夠構(gòu)建和部署更復(fù)雜的AI agents,這些agents可以處理海量數(shù)據(jù),并與其他agents、大語言模型及外部系統(tǒng)工具進行交互。
Writer提供精確且完全自主的模型,杜絕后期訓(xùn)練量化與知識蒸餾,確保今天驗證的行為模式與明天的行為模式保持一致。Palmyra X5在此基礎(chǔ)上強化技術(shù)承諾,嚴(yán)格保持后向兼容性以避免團隊重復(fù)調(diào)優(yōu)流程的痛苦,同時發(fā)布客戶可參與制定的公開企業(yè)技術(shù)路線圖,并通過優(yōu)化推理延遲,使即便在百萬token量級下,大語言模型交互和檢索增強生成(RAG)也能實現(xiàn)近乎即時的響應(yīng)。
Writer宣布,得益于創(chuàng)新型Transformer設(shè)計(一種支持輸入數(shù)據(jù)并行處理而非順序處理的架構(gòu))與混合注意力機制(允許多種方式同時關(guān)注信息,既保證效率也確保效果),其未來發(fā)布的所有大語言模型將以一百萬token作為最小上下文窗口規(guī)模。這意味著企業(yè)可基于持續(xù)擴展的AI能力制定長期戰(zhàn)略,而不受限于上下文窗口的規(guī)模約束。
訪問亞馬遜云科技新聞博客獲取Palmyra X5的詳細信息,包括模型在Amazon Bedrock的部署方法與潛在用例,并查看Amazon Bedrock中的Writer產(chǎn)品頁面。立即訪問Amazon Bedrock控制臺開始使用Palmyra X5和 Palmyra X4。