北京2024年9月5日 /美通社/ -- 亞馬遜云科技宣布,Stability AI最新發(fā)布的三款文本生成圖像模型:Stable Image Ultra、Stable Diffusion 3 Large和Stable Image Core現(xiàn)已在Amazon Bedrock中正式可用。這些模型大大提升了對包含多個對象提示詞的處理能力、圖像質量和文字排版效果,可廣泛應用于營銷、廣告、媒體、娛樂、零售等領域,快速生成高質量視覺內容。
這些模型生成的圖像異常逼真,具有生動的細節(jié)、色彩和明暗效果,并有效解決了如手部和面部真實感渲染等常見挑戰(zhàn)。憑借卓越的提示詞理解能力,這些模型能夠準確解釋涉及空間推理、構圖和風格的復雜指令。
Amazon Bedrock上提供的三款Stability AI新模型覆蓋了不同的使用場景:
Stable Image Ultra——可生成最高質量的寫實輸出,適用于專業(yè)印刷媒體和大尺寸印刷等場景。該模型在細節(jié)渲染和寫實性方面表現(xiàn)卓越。
Stable Diffusion 3 Large——在圖像生成速度和質量之間實現(xiàn)平衡,是制作網(wǎng)站、新聞簡報和營銷材料等大批量、高質量數(shù)字內容的理想之選。
Stable Image Core——專門用于快速且經(jīng)濟地生成圖像,非常適合在創(chuàng)意構思階段快速迭代。
新模型的關鍵特性:
特性 |
Stable Image Ultra |
Stable Diffusion 3 Large |
Stable Image Core |
參數(shù) |
160億 |
80億 |
26億 |
輸入 |
文本 |
文本或圖像 |
文本 |
排版 |
為大規(guī)模展示定制 |
為大規(guī)模展示定制 |
適用不同尺寸和應用場景,具有多樣性和可讀性 |
視覺美感 |
超寫實圖像輸出 |
高度寫實,細節(jié)更精細 |
良好的渲染效果,但細節(jié)不如其他模型豐富 |
相比 Stable Diffusion XL (SDXL) ,Stable Image Ultra 和 Stable Diffusion 3 Large的主要改進之一是生成圖像中的文字質量。得益于創(chuàng)新的Diffusion Transformer架構,新模型減少了拼寫和排版錯誤。該架構為圖像和文字分別設計了兩套獨立的權重,但允許兩種模態(tài)之間的信息流動。
以下是使用這些模型生成的一些圖像。
Stable Image Ultra – 提示詞:照片,寫實風格,一名女子坐在田野中看著天空中的風箏,暴風雨的天空,細節(jié)豐富,概念藝術,復雜、專業(yè)構圖。
Stable Diffusion 3 Large – 提示詞:漫畫風格插畫,男偵探站在路燈下,黑暗城市,穿著風衣,戴著軟呢帽,雨夜,霓虹燈招牌,濕漉漉的人行道上的倒影,細節(jié)豐富,氛圍感十足的光影。
Stable Image Core – 提示詞:專業(yè)的 3D 渲染,一只白色和橙色的運動鞋,懸浮在中心,漂浮,高質量,寫實風格。
Amazon Bedrock 中 Stability AI 新模型的應用場景
文本生成圖像模型為各行業(yè)的企業(yè)帶來了變革性的潛力,能夠顯著簡化營銷和廣告部門的創(chuàng)意工作流程,為營銷活動、社交媒體內容和產(chǎn)品模型快速生成高質量的視覺效果。通過加快創(chuàng)作過程,企業(yè)可以更快地響應市場趨勢,縮短新產(chǎn)品或項目的上市時間。此外,這些模型還能在創(chuàng)意討論階段為概念提供即時的視覺呈現(xiàn),激發(fā)更多創(chuàng)新靈感。
對于電商企業(yè),AI生成的圖像可以幫助大規(guī)模創(chuàng)建多樣化的產(chǎn)品展示和個性化營銷材料。在用戶體驗和界面設計領域,這些工具能夠快速生成線框圖和原型,加快推動設計迭代過程。采用文本生成圖像模型可以顯著節(jié)約成本、提高生產(chǎn)效率,并在視覺傳播方面為各行業(yè)企業(yè)提供競爭優(yōu)勢。
以下是一些跨行業(yè)的應用場景示例:
廣告與營銷
電商
媒體與娛樂
Stability AI三款全新模型——Stable Image Ultra、Stable Diffusion 3 Large 和 Stable Image Core今天起在的亞馬遜云科技美國西部(俄勒岡州)區(qū)域內的Amazon Bedrock正式可用。