omniture

南棲仙策最新發(fā)布強(qiáng)化學(xué)習(xí)工業(yè)軟件和預(yù)訓(xùn)練模型

南京2022年11月7日 /美通社/ -- 11月3日南棲仙策通用智能決策2022發(fā)布會(huì)上,介紹了強(qiáng)化學(xué)習(xí)工業(yè)軟件REVIVE的新版本,更為驚艷的是,還發(fā)布了首個(gè)工業(yè)控制預(yù)訓(xùn)練模型。可以預(yù)見(jiàn)到強(qiáng)化學(xué)習(xí),這一曾經(jīng)在圍棋上戰(zhàn)勝人類(lèi)的AI技術(shù),將為工業(yè)場(chǎng)景將帶來(lái)巨大變革。

智能決策平臺(tái)REVIVE(Reinforcement learning with Virtualized Environment),能夠?qū)⑸倭繗v史數(shù)據(jù)轉(zhuǎn)化為強(qiáng)大的決策引擎。

"我們?cè)诙嗄甑穆涞亟?jīng)驗(yàn)中,吸取了非常多的教訓(xùn),我們相信這個(gè)版本,能夠帶來(lái)更加智能,準(zhǔn)確,靈活,可信的智能決策結(jié)果。" 南棲仙策聯(lián)合創(chuàng)始人秦熔均這樣介紹。新發(fā)布的REVIVE更智能、更準(zhǔn)確、更靈活、更可信:

更加智能:新版本的REVIVE SDK引入變量因果分析工具,將用戶(hù)從稠密的數(shù)據(jù)和復(fù)雜交錯(cuò)的流程當(dāng)中解脫出來(lái),自動(dòng)進(jìn)行結(jié)構(gòu)優(yōu)化和推薦,幫助用戶(hù)輕松構(gòu)建模型和進(jìn)行虛擬環(huán)境的訓(xùn)練。

更加準(zhǔn)確:正如人類(lèi)在做決策時(shí)可以很快認(rèn)知他所面臨的環(huán)境,REVIVE通過(guò)生成、自動(dòng)識(shí)別并自動(dòng)匹配不同環(huán)境和最佳元策略模型,對(duì)最終的策略進(jìn)行調(diào)優(yōu)。針對(duì)實(shí)際環(huán)境,選擇出最適宜準(zhǔn)確的決策。

更加靈活:在現(xiàn)實(shí)應(yīng)用中往往會(huì)有一些隱藏變量,新版REVIVE可以輕松添加隱變量模塊,將缺失值也納入考量。同時(shí),新版本也更容易拆分出子模塊進(jìn)行修改和復(fù)用。

更加可信:REVIVE提供了決策的樹(shù)狀可視化狀態(tài),用戶(hù)可以主動(dòng)和模型進(jìn)行交互,看看做了不同改變會(huì)獲得怎樣不同的結(jié)果,嘗試不同決策,預(yù)見(jiàn)不同未來(lái)。


除了面向通用決策場(chǎng)景的REVIVE SDK,本場(chǎng)發(fā)布會(huì)上最驚艷的內(nèi)容,是面向工業(yè)反饋控制任務(wù)的決策預(yù)訓(xùn)練模型。

通用反饋控制預(yù)訓(xùn)練模型

反饋控制任務(wù)廣泛存在于大量的工業(yè)場(chǎng)景中。這類(lèi)任務(wù)需要對(duì)實(shí)施過(guò)程中的每一步所引起的客觀效果進(jìn)行感知和反饋,并據(jù)此做出控制反應(yīng),調(diào)整下一步的計(jì)劃決策和實(shí)施方案,在往復(fù)動(dòng)態(tài)中達(dá)到控制目標(biāo)。

不同的場(chǎng)景之下,工程師們需要根據(jù)不同的場(chǎng)景和環(huán)境去調(diào)整每一個(gè)控制參數(shù),達(dá)到控制效果。如果能夠?qū)崿F(xiàn)通用的反饋控制系統(tǒng),將為工業(yè)應(yīng)用帶來(lái)巨大變革。

要實(shí)現(xiàn)這項(xiàng)技術(shù)的關(guān)鍵核心在于,對(duì)不同任務(wù)的自動(dòng)識(shí)別。只有當(dāng)它識(shí)別了當(dāng)前的任務(wù)是什么,才能根據(jù)任務(wù)調(diào)整控制策略,以做到對(duì)不同的任務(wù)都做出最優(yōu)的決策。

針對(duì)這個(gè)問(wèn)題,南棲仙策推出了通用反饋控制系統(tǒng)識(shí)別器:GFSEncoder。它能夠輸出3維的編碼,來(lái)識(shí)別和表達(dá)不同反饋控制系統(tǒng)的特征和變化。


作為神經(jīng)網(wǎng)絡(luò)對(duì)系統(tǒng)的理解,GFSEncoder編碼的每一維不會(huì)直接對(duì)應(yīng)到系統(tǒng)的物理參數(shù),但是二者依然會(huì)存在一定聯(lián)系。

南棲仙策還額外發(fā)布了GFSEncoder Pro,將參數(shù)量提升50%以上。輸出的任務(wù)編碼維度從3維提升至8維,具有更強(qiáng)大的任務(wù)識(shí)別和編碼能力。


在發(fā)布會(huì)上,南棲仙策以滑塊的控制為例,展示了特征編碼是如何隨著物理參數(shù)的變化而變化的。B站搜索南棲仙策 https://www.bilibili.com/video/BV1Bd4y1c7n7/?spm_id_from=333.999.0.0&vd_source=81e9203bcfc1f33b834d254f33b023c7 可以看到完整的演示過(guò)程。

最后還需要強(qiáng)調(diào)的是,GFSEncoder并不需要額外測(cè)量系統(tǒng)的各種參數(shù)。

GFSEncoder下游應(yīng)用

(一)系統(tǒng)變動(dòng)預(yù)警

很多系統(tǒng)在長(zhǎng)時(shí)間的運(yùn)行后會(huì)發(fā)生老化或者損壞。通過(guò)比對(duì)GFSEncoder輸出的編碼可實(shí)時(shí)監(jiān)控系統(tǒng)是否出現(xiàn)變化,預(yù)警系統(tǒng)失效。

(二)系統(tǒng)標(biāo)定

GFSEncoder還可以根據(jù)當(dāng)前系統(tǒng)編碼與標(biāo)準(zhǔn)系統(tǒng)編碼的差異來(lái)調(diào)整系統(tǒng)的參數(shù),使用戶(hù)不需要精密測(cè)量,就可以將系統(tǒng)向標(biāo)準(zhǔn)系統(tǒng)校準(zhǔn)。

(三)PID參數(shù)預(yù)測(cè)

在這個(gè)應(yīng)用中,南棲仙策介紹了將要推出的第二個(gè)模型,PIDPredictor。

PIDPredictor也是一個(gè)深度神經(jīng)網(wǎng)絡(luò)模型,能夠基于GFSEncoder編碼對(duì)相應(yīng)的最優(yōu)PID參數(shù)進(jìn)行預(yù)測(cè)。GFSEncoder與PIDPredictor相結(jié)合,可以通過(guò)系統(tǒng)中的歷史軌跡信息得到最優(yōu)PID參數(shù)。


在展示當(dāng)中,可以看出PIDPredictor所預(yù)測(cè)的PID參數(shù)的控制效果(右側(cè))會(huì)比待整定的PID控制器好很多。B站搜索南棲仙策可以看到完整的演示過(guò)程。

(四)通用反饋任務(wù)控制

南棲仙策還將PID控制器用神經(jīng)網(wǎng)絡(luò)控制器替代,推出了通用反饋控制器,GFSController。GFSController是使用強(qiáng)化學(xué)習(xí)訓(xùn)練得到的通用控制器,它由GFSEncoder與一個(gè)神經(jīng)網(wǎng)絡(luò)控制器組合而成。

結(jié)合GFSEncoder對(duì)系統(tǒng)的快速編碼能力,GFSController可以做到部署即運(yùn)行。

發(fā)布會(huì)以平衡車(chē)任務(wù)為例,進(jìn)行了展示。在部署了GFSEncoder之后,無(wú)需進(jìn)行任何針對(duì)性的調(diào)節(jié),GFSController就能夠直接將平衡車(chē)控制在穩(wěn)定的狀態(tài)。

作為驗(yàn)證,南棲仙策將GFSController部署至無(wú)人機(jī)高度控制任務(wù)中。作為對(duì)比,南棲仙策還引入了一個(gè)調(diào)好的二階PID完成同樣的任務(wù),可以看出,GFSController與一個(gè)調(diào)好的PID控制器表現(xiàn)出了相當(dāng)?shù)乃健?/p>

為了測(cè)試GFSController通用性,發(fā)布會(huì)上,南棲仙策對(duì)更多的衍生場(chǎng)景進(jìn)行了假設(shè)和模擬:如果有一天人類(lèi)登陸火星或是在高空飛行,這個(gè)無(wú)人機(jī)能否適應(yīng)新的環(huán)境變化?

GFSController很快就完成了對(duì)新系統(tǒng)的識(shí)別,其超調(diào)已經(jīng)明顯降低,然而PID控制器的超調(diào)依然很?chē)?yán)重,以致于最后無(wú)人機(jī)撞擊到地面并損毀。B站搜索南棲仙策可以看到完整的演示過(guò)程。


需要注意的是,這里的PID控制器是一個(gè)二階級(jí)聯(lián)的PID控制器。而GFSController則是一階控制的。事實(shí)上,GFSController也能夠通過(guò)級(jí)聯(lián)來(lái)提升控制效果。這意味著GFSController除了通用性之外,還具有強(qiáng)大的拓展性。

南棲仙策已經(jīng)將GFSEncoder的相關(guān)的模型發(fā)布到了REVIVE官網(wǎng)。https://revive.cn 歡迎大家下載體驗(yàn)。

消息來(lái)源:南棲仙策(南京)科技有限公司
China-PRNewsire-300-300.png
能動(dòng)
微信公眾號(hào)“能動(dòng)”發(fā)布全球能源、化工、采礦、動(dòng)力、新能源車(chē)企業(yè)最新的經(jīng)營(yíng)動(dòng)態(tài)。掃描二維碼,立即訂閱!
collection