omniture

AWS發(fā)布 Amazon DevOps Guru

機(jī)器學(xué)習(xí)驅(qū)動(dòng)的全新運(yùn)營(yíng)服務(wù)為提高應(yīng)用程序可用性提供定制化建議
AWS
2020-12-08 09:52 3379
今天,在亞馬遜云服務(wù)舉辦的年度盛會(huì) -- AWS re:Invent上,AWS宣布了完全托管的運(yùn)營(yíng)服務(wù)Amazon DevOps Guru。利用機(jī)器學(xué)習(xí)技術(shù),這一服務(wù)可以幫助開(kāi)發(fā)人員通過(guò)自動(dòng)檢測(cè)操作問(wèn)題和建議補(bǔ)救措施來(lái)提高應(yīng)用程序可用性。

北京2020年12月8日 /美通社/ -- 在亞馬遜云服務(wù)(AWS)舉辦的年度盛會(huì) -- AWS re:Invent上,AWS宣布了完全托管的運(yùn)營(yíng)服務(wù)Amazon DevOps Guru。利用機(jī)器學(xué)習(xí)技術(shù),這一服務(wù)可以幫助開(kāi)發(fā)人員通過(guò)自動(dòng)檢測(cè)操作問(wèn)題和建議補(bǔ)救措施來(lái)提高應(yīng)用程序可用性。Amazon DevOps Guru應(yīng)用了支持Amazon.com和AWS卓越運(yùn)營(yíng)多年的機(jī)器學(xué)習(xí)技術(shù),通過(guò)自動(dòng)收集和分析應(yīng)用程序指標(biāo)、日志、事件和痕跡等數(shù)據(jù),識(shí)別偏離正常操作模式的行為(例如,計(jì)算能力配置不足、數(shù)據(jù)庫(kù) I/O過(guò)度使用、內(nèi)存泄漏等)。當(dāng)Amazon DevOps Guru識(shí)別出可能導(dǎo)致服務(wù)中斷的異常應(yīng)用程序行為(例如,延遲、錯(cuò)誤率和資源限制等增加)時(shí),它將向開(kāi)發(fā)人員發(fā)出問(wèn)題詳細(xì)信息(例如,涉及的資源、問(wèn)題時(shí)間表和相關(guān)事件等),并通過(guò)Amazon Simple Notification Service(SNS)以及Atlassian Opsgenie和PagerDuty等合作伙伴集成服務(wù)來(lái)幫助開(kāi)發(fā)人員快速了解問(wèn)題的潛在影響和可能原因,并提出具體的修復(fù)建議。開(kāi)發(fā)人員可以使用Amazon DevOps Guru的修復(fù)建議來(lái)減少問(wèn)題修復(fù)時(shí)間,無(wú)需手動(dòng)設(shè)置或機(jī)器學(xué)習(xí)專業(yè)知識(shí)即可提高應(yīng)用程序的可用性和可靠性。Amazon DevOps Guru沒(méi)有前期成本或承諾,客戶只需為Amazon DevOps Guru分析的數(shù)據(jù)付費(fèi)。訪問(wèn)https://aws.amazon.com/cn/devops-guru/ 即可開(kāi)始使用Amazon DevOps Guru。

為了擺脫本地部署的限制并向全球擴(kuò)展業(yè)務(wù)運(yùn)營(yíng),越來(lái)越多的組織開(kāi)始轉(zhuǎn)向基于云的應(yīng)用程序部署和微服務(wù)架構(gòu),這也導(dǎo)致應(yīng)用程序?yàn)闈M足客戶需求而變得越來(lái)越分散。開(kāi)發(fā)人員需要更多的自動(dòng)化方式來(lái)維護(hù)應(yīng)用程序的可用性,減少花費(fèi)在檢測(cè)、調(diào)試和解決運(yùn)營(yíng)問(wèn)題上的時(shí)間和精力。錯(cuò)誤的代碼或配置更改、不平衡的容器集群或CPU、內(nèi)存、磁盤等資源耗盡帶來(lái)的應(yīng)用程序宕機(jī)事件將不可避免地導(dǎo)致不良客戶體驗(yàn)和收入損失。企業(yè)需要花費(fèi)大量資金和開(kāi)發(fā)人員時(shí)間來(lái)部署多個(gè)監(jiān)測(cè)工具,而這些監(jiān)測(cè)工具通常是分開(kāi)管理的,并且必須針對(duì)負(fù)載平衡器錯(cuò)誤或應(yīng)用程序請(qǐng)求率下降等常見(jiàn)問(wèn)題開(kāi)發(fā)和維護(hù)自定義警報(bào)。對(duì)于希望通過(guò)設(shè)置閾值以識(shí)別和警告應(yīng)用程序資源異常狀況的企業(yè)來(lái)說(shuō),不僅很難設(shè)置準(zhǔn)確的閾值,涉及諸多手動(dòng)操作,并且要求閾值必須隨著應(yīng)用程序使用情況的變化而不斷更新(例如,在假日購(gòu)物季時(shí)突增大量請(qǐng)求)。如果閾值設(shè)置得太高,開(kāi)發(fā)人員在運(yùn)營(yíng)性能已經(jīng)嚴(yán)重受損前無(wú)法收到警報(bào)。當(dāng)閾值設(shè)置得太低時(shí),開(kāi)發(fā)人員則可能得到過(guò)多誤報(bào)并最終忽略警報(bào)。即使開(kāi)發(fā)人員對(duì)潛在的操作問(wèn)題已經(jīng)有所警覺(jué),仍然很難尋找和確認(rèn)問(wèn)題根源。使用現(xiàn)有工具,開(kāi)發(fā)人員通常很難從圖形和警報(bào)中確定問(wèn)題根源,而即使找到根本原因,也往往無(wú)法解決問(wèn)題。每次故障排除都是冷啟動(dòng),團(tuán)隊(duì)必須花費(fèi)數(shù)小時(shí)或數(shù)天來(lái)識(shí)別問(wèn)題,這種工作既耗時(shí)又繁瑣,從而減緩了解決操作故障的時(shí)間,并可能延長(zhǎng)應(yīng)用程序的中斷時(shí)間。

Amazon DevOps Guru的機(jī)器學(xué)習(xí)模型采用了亞馬遜過(guò)去20多年為Amazon.com構(gòu)建、擴(kuò)展和維護(hù)高可用應(yīng)用程序的運(yùn)營(yíng)專業(yè)知識(shí)。這使Amazon DevOps Guru能夠自動(dòng)檢測(cè)運(yùn)營(yíng)故障(例如,警報(bào)遺漏或配置錯(cuò)誤,資源耗盡的早期警告,可能導(dǎo)致停機(jī)的配置更改等),提供有關(guān)資源和相關(guān)事件的背景,并建議補(bǔ)救措施,而無(wú)需開(kāi)發(fā)人員具備任何機(jī)器學(xué)習(xí)經(jīng)驗(yàn)。開(kāi)發(fā)人員只需在Amazon DevOps Guru控制臺(tái)中單擊幾下,即可自動(dòng)提取和分析所有資源的歷史應(yīng)用程序和延遲、錯(cuò)誤率、請(qǐng)求率等基礎(chǔ)架構(gòu)指標(biāo),以建立操作基線,然后Amazon DevOps Guru就可以開(kāi)始通過(guò)預(yù)先訓(xùn)練的機(jī)器學(xué)習(xí)模型識(shí)別與既定基線的偏差。當(dāng)Amazon DevOps Guru分析系統(tǒng)和應(yīng)用程序數(shù)據(jù)以自動(dòng)檢測(cè)異常時(shí),它還將這些數(shù)據(jù)分組為運(yùn)營(yíng)洞察,包括異常指標(biāo)、隨著時(shí)間的推移對(duì)應(yīng)用程序行為可視化、以及有關(guān)補(bǔ)救措施的建議。Amazon DevOps Guru還將相關(guān)的應(yīng)用程序和基礎(chǔ)架構(gòu)指標(biāo)(例如Web應(yīng)用程序延遲峰值、磁盤空間用盡、錯(cuò)誤的代碼部署、內(nèi)存泄漏等)相關(guān)聯(lián)并進(jìn)行分組,以減少冗余警報(bào)并幫助用戶關(guān)注高嚴(yán)重性問(wèn)題。客戶可以通過(guò)查看配置更改歷史記錄、部署事件以及系統(tǒng)和用戶活動(dòng),以在Amazon DevOps Guru控制臺(tái)中生成需要優(yōu)先關(guān)注的潛在操作問(wèn)題事件列表。為了幫助客戶快速解決問(wèn)題,Amazon DevOps Guru提供了具有補(bǔ)救步驟的智能建議,并與AWS Systems Manager集成運(yùn)行手冊(cè)和協(xié)作工具,使客戶能夠更有效地維護(hù)應(yīng)用程序并管理其部署的基礎(chǔ)架構(gòu)。Amazon DevOps Guru與Amazon CodeGuru(機(jī)器學(xué)習(xí)支持的開(kāi)發(fā)人員工具,可提供智能建議以提高代碼質(zhì)量并識(shí)別應(yīng)用程序中最昂貴的代碼行)一起,使客戶可以針對(duì)其操作數(shù)據(jù)使用自動(dòng)化機(jī)器學(xué)習(xí)技術(shù),幫助開(kāi)發(fā)人員輕松提高應(yīng)用程序的可用性和可靠性。

負(fù)責(zé)亞馬遜機(jī)器學(xué)習(xí)的AWS副總裁Swami Sivasubramanian表示:“客戶希望AWS繼續(xù)在我們可以運(yùn)用自己的專業(yè)知識(shí)來(lái)提高應(yīng)用程序可用性的領(lǐng)域中增加服務(wù),并從Amazon.com的多年運(yùn)營(yíng)經(jīng)驗(yàn)中學(xué)習(xí)。借助Amazon DevOps Guru,我們利用亞馬遜過(guò)往的經(jīng)驗(yàn)建立了專門的機(jī)器學(xué)習(xí)模型,幫助客戶檢測(cè)、排除故障并防止操作問(wèn)題,并在出現(xiàn)問(wèn)題時(shí)提供智能化建議。這使得客戶可以立即從亞馬遜在運(yùn)營(yíng)Amazon.com中學(xué)到的最佳操作實(shí)踐中受益,節(jié)省配置和管理多個(gè)監(jiān)測(cè)系統(tǒng)上所花費(fèi)的時(shí)間和精力?!?/p>

只需在AWS管理控制臺(tái)中單擊幾下,客戶就可以在數(shù)分鐘內(nèi)開(kāi)始使用Amazon DevOps Guru分析賬戶和應(yīng)用程序活動(dòng),提供運(yùn)營(yíng)見(jiàn)解。Amazon DevOps Guru通過(guò)匯總AWS CloudTrail、Amazon CloudWatch、AWS Config、AWS CloudFormation、AWS X-Ray等多個(gè)來(lái)源中的相關(guān)數(shù)據(jù),讓客戶可以通過(guò)一個(gè)控制臺(tái)可視化其運(yùn)營(yíng)數(shù)據(jù),減少了在多種工具之間切換的需要??蛻暨€可以在Amazon DevOps Guru控制臺(tái)中查看相關(guān)的運(yùn)營(yíng)事件和數(shù)據(jù)以獲得運(yùn)營(yíng)見(jiàn)解,并通過(guò)Amazon SNS接收警報(bào)。此外,Amazon DevOps Guru通過(guò)AWS軟件開(kāi)發(fā)工具包(AWS SDK)支持API終端節(jié)點(diǎn),使合作伙伴和客戶可以輕松地將Amazon DevOps Guru集成到其現(xiàn)有解決方案中,以針對(duì)高嚴(yán)重性問(wèn)題提交故障單、分級(jí)并自動(dòng)通知工程師。 PagerDuty和Atlassian已將Amazon DevOps Guru集成到其運(yùn)營(yíng)監(jiān)控和事件管理平臺(tái)中,使用其解決方案的客戶現(xiàn)在可以從Amazon DevOps Guru提供的運(yùn)營(yíng)見(jiàn)解中受益。 Amazon DevOps Guru現(xiàn)已在美國(guó)東部(北弗吉尼亞)區(qū)域、美國(guó)東部(俄亥俄)區(qū)域、美國(guó)西部(俄勒岡)區(qū)域、亞太(新加坡)區(qū)域和歐洲(愛(ài)爾蘭)區(qū)域進(jìn)行預(yù)覽,并將在未來(lái)幾個(gè)月中在其它地區(qū)推出。

超過(guò)170,000個(gè)企業(yè)依靠Atlassian產(chǎn)品來(lái)簡(jiǎn)化團(tuán)隊(duì)合作,組織、討論和完成工作。Opsgenie產(chǎn)品負(fù)責(zé)人Emel Dogrusoz表示:“Atlassian很榮幸能與AWS就Amazon DevOps Guru推出達(dá)成合作,幫助更多開(kāi)發(fā)團(tuán)隊(duì)部署代碼和運(yùn)營(yíng)服務(wù)。通過(guò)與Opsgenie和Jira Service Management集成,Amazon DevOps Guru可以在預(yù)測(cè)到潛在問(wèn)題或確定事件發(fā)生時(shí)立即通知相關(guān)團(tuán)隊(duì)。Amazon DevOps Guru提供了新的洞察力,而Atlassian確保了最快的響應(yīng)速度?!?/p>

PagerDuty,Inc. (NYSE: PD) 是數(shù)字運(yùn)營(yíng)管理的領(lǐng)導(dǎo)者。PagerDuty產(chǎn)品副總裁Jonathan Rende表示:“PagerDuty致力于通過(guò)全生命周期事件自動(dòng)化響應(yīng)來(lái)推動(dòng)向DevOps文化的轉(zhuǎn)變。我們很高興能夠通過(guò)與Amazon DevOps Guru的集成來(lái)繼續(xù)深化對(duì)DevOps的承諾。借助亞馬遜數(shù)十年來(lái)的卓越運(yùn)營(yíng)經(jīng)驗(yàn)和Amazon DevOps Guru的機(jī)器學(xué)習(xí)功能,PagerDuty為我們的共同客戶提供了更多的實(shí)時(shí)信號(hào)到響應(yīng)功能。通過(guò)PagerDuty提取的Amazon DevOps Guru的Amazon SNS,AWS客戶可以在運(yùn)營(yíng)事件影響用戶服務(wù)中斷之前對(duì)其采取實(shí)時(shí)行動(dòng)?!?/p>

湯森路透是全球最受信賴的信息和資訊提供商之一,幫助專業(yè)人士做出自信的決定并更好的經(jīng)營(yíng)業(yè)務(wù)。湯姆森路透基礎(chǔ)設(shè)施托管業(yè)務(wù)主管史蒂夫·索恩斯說(shuō):“客戶體驗(yàn)對(duì)我們至關(guān)重要。在試圖防止和減輕影響客戶的事件時(shí),處理可用性、性能和變更請(qǐng)求的多種警報(bào)可能是一個(gè)挑戰(zhàn)。我們很高興能夠使用Amazon DevOps Guru并利用其機(jī)器學(xué)習(xí)見(jiàn)解為快速解決問(wèn)題并避免影響客戶的事件提供清晰路徑。這一服務(wù)與PagerDuty的集成則可以幫助我們將Amazon DevOps Guru提供的問(wèn)題解決建議及時(shí)有效地交付給正確的團(tuán)隊(duì)?!?/p>

SmugMug是一個(gè)提供付費(fèi)的圖片共享和托管服務(wù)及在線視頻的平臺(tái),用戶可以在該平臺(tái)上傳照片和視頻。該公司為業(yè)余和專業(yè)攝影師促進(jìn)數(shù)字化和印刷作品的銷售。SmugMug運(yùn)營(yíng)總監(jiān)Andrew Shieh說(shuō):“我的團(tuán)隊(duì)一直在尋找讓手動(dòng)工作自動(dòng)化的方法。我們希望能夠通過(guò)Amazon DevOps Guru實(shí)現(xiàn)這一目標(biāo),讓AIOps接管我們的許多日常任務(wù),簡(jiǎn)化日常運(yùn)營(yíng),從而專注于IT創(chuàng)新?,F(xiàn)在,我們不僅滿足了業(yè)務(wù)需求,而且能夠超出業(yè)務(wù)預(yù)期,因?yàn)槲覀冇懈鄷r(shí)間專注于最重要的事情 -- 為我們的組織和客戶創(chuàng)造價(jià)值?!?/p>

NextRoll通過(guò)幫助市場(chǎng)和營(yíng)銷平臺(tái)構(gòu)建和增強(qiáng)其營(yíng)銷解決方案提高收益。NextRoll的首席技術(shù)官Valentino Volonghi說(shuō):“我們運(yùn)行著數(shù)千個(gè)Amazon Elastic Compute Cloud (Amazon EC2) 實(shí)例,一直在尋找能夠減少團(tuán)隊(duì)用于解決運(yùn)營(yíng)問(wèn)題時(shí)間的方法。很高興能夠使用Amazon DevOps Guru并利用其基于機(jī)器學(xué)習(xí)的洞察來(lái)幫助我們識(shí)別、關(guān)聯(lián)和解決運(yùn)營(yíng)問(wèn)題。這將幫助我的團(tuán)隊(duì)節(jié)省時(shí)間并減少我們的平均恢復(fù)時(shí)間?!?/p>

消息來(lái)源:AWS
China-PRNewsire-300-300.png
全球TMT
微信公眾號(hào)“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營(yíng)動(dòng)態(tài)、財(cái)報(bào)信息、企業(yè)并購(gòu)消息。掃描二維碼,立即訂閱!
collection