Amazon Bedrock上線Stability AI三款最新圖像生成模型

亞馬遜云科技

2024-09-05 16:58 5727

北京2024年9月5日 /美通社/ -- 亞馬遜云科技宣布，Stability AI最新發(fā)布的三款文本生成圖像模型：Stable Image Ultra、Stable Diffusion 3 Large和Stable Image Core現(xiàn)已在Amazon Bedrock中正式可用。這些模型大大提升了對(duì)包含多個(gè)對(duì)象提示詞的處理能力、圖像質(zhì)量和文字排版效果，可廣泛應(yīng)用于營(yíng)銷(xiāo)、廣告、媒體、娛樂(lè)、零售等領(lǐng)域，快速生成高質(zhì)量視覺(jué)內(nèi)容。

這些模型生成的圖像異常逼真，具有生動(dòng)的細(xì)節(jié)、色彩和明暗效果，并有效解決了如手部和面部真實(shí)感渲染等常見(jiàn)挑戰(zhàn)。憑借卓越的提示詞理解能力，這些模型能夠準(zhǔn)確解釋涉及空間推理、構(gòu)圖和風(fēng)格的復(fù)雜指令。

Amazon Bedrock上提供的三款Stability AI新模型覆蓋了不同的使用場(chǎng)景：

Stable Image Ultra——可生成最高質(zhì)量的寫(xiě)實(shí)輸出，適用于專(zhuān)業(yè)印刷媒體和大尺寸印刷等場(chǎng)景。該模型在細(xì)節(jié)渲染和寫(xiě)實(shí)性方面表現(xiàn)卓越。

Stable Diffusion 3 Large——在圖像生成速度和質(zhì)量之間實(shí)現(xiàn)平衡，是制作網(wǎng)站、新聞簡(jiǎn)報(bào)和營(yíng)銷(xiāo)材料等大批量、高質(zhì)量數(shù)字內(nèi)容的理想之選。

Stable Image Core——專(zhuān)門(mén)用于快速且經(jīng)濟(jì)地生成圖像，非常適合在創(chuàng)意構(gòu)思階段快速迭代。

新模型的關(guān)鍵特性：

特性	Stable Image Ultra	Stable Diffusion 3 Large	Stable Image Core
參數(shù)	160億	80億	26億
輸入	文本	文本或圖像	文本
排版	為大規(guī)模展示定制	為大規(guī)模展示定制	適用不同尺寸和應(yīng)用場(chǎng)景，具有多樣性和可讀性
視覺(jué)美感	超寫(xiě)實(shí)圖像輸出	高度寫(xiě)實(shí)，細(xì)節(jié)更精細(xì)	良好的渲染效果，但細(xì)節(jié)不如其他模型豐富

相比 Stable Diffusion XL (SDXL) ，Stable Image Ultra 和 Stable Diffusion 3 Large的主要改進(jìn)之一是生成圖像中的文字質(zhì)量。得益于創(chuàng)新的Diffusion Transformer架構(gòu)，新模型減少了拼寫(xiě)和排版錯(cuò)誤。該架構(gòu)為圖像和文字分別設(shè)計(jì)了兩套獨(dú)立的權(quán)重，但允許兩種模態(tài)之間的信息流動(dòng)。

以下是使用這些模型生成的一些圖像。

Stable Image Ultra – 提示詞：照片，寫(xiě)實(shí)風(fēng)格，一名女子坐在田野中看著天空中的風(fēng)箏，暴風(fēng)雨的天空，細(xì)節(jié)豐富，概念藝術(shù)，復(fù)雜、專(zhuān)業(yè)構(gòu)圖。

Stable Diffusion 3 Large – 提示詞：漫畫(huà)風(fēng)格插畫(huà)，男偵探站在路燈下，黑暗城市，穿著風(fēng)衣，戴著軟呢帽，雨夜，霓虹燈招牌，濕漉漉的人行道上的倒影，細(xì)節(jié)豐富，氛圍感十足的光影。

Stable Image Core – 提示詞：專(zhuān)業(yè)的 3D 渲染，一只白色和橙色的運(yùn)動(dòng)鞋，懸浮在中心，漂浮，高質(zhì)量，寫(xiě)實(shí)風(fēng)格。

Amazon Bedrock 中 Stability AI 新模型的應(yīng)用場(chǎng)景

文本生成圖像模型為各行業(yè)的企業(yè)帶來(lái)了變革性的潛力，能夠顯著簡(jiǎn)化營(yíng)銷(xiāo)和廣告部門(mén)的創(chuàng)意工作流程，為營(yíng)銷(xiāo)活動(dòng)、社交媒體內(nèi)容和產(chǎn)品模型快速生成高質(zhì)量的視覺(jué)效果。通過(guò)加快創(chuàng)作過(guò)程，企業(yè)可以更快地響應(yīng)市場(chǎng)趨勢(shì)，縮短新產(chǎn)品或項(xiàng)目的上市時(shí)間。此外，這些模型還能在創(chuàng)意討論階段為概念提供即時(shí)的視覺(jué)呈現(xiàn)，激發(fā)更多創(chuàng)新靈感。

對(duì)于電商企業(yè)，AI生成的圖像可以幫助大規(guī)模創(chuàng)建多樣化的產(chǎn)品展示和個(gè)性化營(yíng)銷(xiāo)材料。在用戶(hù)體驗(yàn)和界面設(shè)計(jì)領(lǐng)域，這些工具能夠快速生成線框圖和原型，加快推動(dòng)設(shè)計(jì)迭代過(guò)程。采用文本生成圖像模型可以顯著節(jié)約成本、提高生產(chǎn)效率，并在視覺(jué)傳播方面為各行業(yè)企業(yè)提供競(jìng)爭(zhēng)優(yōu)勢(shì)。

以下是一些跨行業(yè)的應(yīng)用場(chǎng)景示例：

廣告與營(yíng)銷(xiāo)

Stable Image Ultra 用于奢侈品牌廣告和寫(xiě)實(shí)的產(chǎn)品展示
Stable Diffusion 3 Large 適用于高質(zhì)量的產(chǎn)品營(yíng)銷(xiāo)圖像和印刷廣告
Stable Image Core 可用于社交媒體廣告視覺(jué)概念的快速 A/B 測(cè)試

電商

Stable Image Ultra適用于高端產(chǎn)品定制和按需生產(chǎn)的商品
Stable Diffusion 3 Large適用于電商網(wǎng)站的大多數(shù)產(chǎn)品視覺(jué)展示
Stable Image Core適用于快速生成產(chǎn)品圖片并保持商品信息的及時(shí)更新

媒體與娛樂(lè)

Stable Image Ultra用于超寫(xiě)實(shí)的主視覺(jué)設(shè)計(jì)、營(yíng)銷(xiāo)材料和游戲畫(huà)面
Stable Diffusion 3 Large適用于環(huán)境紋理、角色設(shè)計(jì)和游戲內(nèi)資產(chǎn)
Stable Image Core用于快速原型制作和概念藝術(shù)探索

Stability AI三款全新模型——Stable Image Ultra、Stable Diffusion 3 Large 和 Stable Image Core今天起在的亞馬遜云科技美國(guó)西部（俄勒岡州）區(qū)域內(nèi)的Amazon Bedrock正式可用。

消息來(lái)源：亞馬遜云科技