深圳2019年4月10日 /美通社/ -- 2019年4月9日,第二屆全球人工智能應用創(chuàng)新峰會在深圳五洲賓館舉行,這場由深圳市科學技術協(xié)會、福田區(qū)科技創(chuàng)新局主辦,鯤云科技、鯤云人工智能應用創(chuàng)新研究院和源創(chuàng)力創(chuàng)新中心承辦的 AI 開年盛會上,鯤云科技發(fā)布全球第一款基于數(shù)據(jù)流技術打造的通用人工智能底層架構 - 定制數(shù)據(jù)流 CAISA 架構和端到端自動編譯工具鏈 RainBuilder,實現(xiàn)了國內(nèi)完全自主產(chǎn)權的 AI 芯片架構,有效計算效率大幅領先國際水平,為人工智能算法的快速應用落地提供高性能算力支撐,推動我國人工智能芯片領域的技術革新和發(fā)展。深圳市人大常委會副主任、深圳市科協(xié)主席蔣宇揚,深圳市福田區(qū)委常委、副區(qū)長黃偉,深圳市源創(chuàng)力離岸創(chuàng)新中心總裁周路明,深圳市科協(xié)秘書長、辦公室主任林肇武,深圳市福田區(qū)科技創(chuàng)新局、發(fā)展和改革局和工業(yè)和信息化局等單位負責同志出席峰會。
打破摩爾定律局限,鯤云發(fā)布全球首款通用底層 AI 架構 - 定制數(shù)據(jù)流 CAISA 架構
作為本次峰會的重頭戲,鯤云科技創(chuàng)始人&CEO 牛昕宇博士在會上發(fā)布了定制數(shù)據(jù)流 CAISA2.0架構。依托創(chuàng)始團隊在數(shù)據(jù)流架構領域近三十年的積累,鯤云的 CAISA 架構拋棄了傳統(tǒng)基于指令集的架構方式,是全球第一款基于數(shù)據(jù)流技術打造的通用人工智能底層架構,可發(fā)揮90%以上的芯片峰值計算性能,大幅領先國際主流 AI 芯片。同時,鯤云還在會上發(fā)布了針對數(shù)據(jù)流架構定制開發(fā)的 RainBuilder 編譯工具鏈,CAISA2.0架構可支持 Tensorflow,Caffe 等開源框架下開發(fā)的主流深度學習算法的無縫遷移,無需用戶進行面向 CAISA 架構的編程?;?Arria10 SX160、SX660、GX1150,Straix10 GX2800系列的 FPGA 加速卡已完成開發(fā)并應用于產(chǎn)品落地中。
隨著人工智能技術的深入發(fā)展,對人工智能芯片的算力提出了更高的要求,算力成為了決定算法落地的重中之重。尤其是在云計算、自動駕駛、安防工業(yè)等領域,算力的提升更是能夠直接帶來更多的用戶量、更多的前端設備智能升級和更安全的自動駕駛汽車。正如圖靈獎得主 John Hennessey 和 David Patterson 在圖靈獎頒獎典禮所言,未來十年,隨著摩爾定律逐步飽和,人工智能芯片的峰值算力將逐步趨近飽和,而架構效率將成為芯片性能的決定因素,未來十年將是計算架構的“黃金十年”。鯤云科技自主研發(fā)的 CAISA2.0架構以及 RainBuilder 編譯工具鏈,沒有采用主流計算機架構下大規(guī)模并行指令集設計的思路,通過完全不同的數(shù)據(jù)流架構突破底層架構的效率瓶頸,最大化發(fā)揮底層硬件的效率,在同等峰值芯片性能情況下可以為人工智能應用提供更高的算力支撐。
打造最好用的 AI 芯片編譯工具,CAISA 架構的端到端自動編譯工具鏈 RainBuilder 面世,讓人工智能更簡單
要實現(xiàn)更快的 AI 應用落地,滿足不同算法開發(fā)的需求,需要一個可以兼容各類算法框架和方便快捷實現(xiàn)算法到硬件寫入的編譯工具。為了降低使用門檻,鯤云發(fā)布了端到端自動編譯工具鏈 RainBuilder,它是一款針對深度學習算法優(yōu)化加速的開發(fā)工具鏈。依托于 CAISA 架構的高性能特性,RainBuilder 提供從算法模型到芯片級算法部署的一整套開發(fā)套件。該套件主要由 Compiler 和 Runtime 兩部分組成,其中 Compiler 包含了一系列命令行接口,支持主流 AI 開發(fā)框架模型的解析和優(yōu)化,并將模型轉化為適用于 CAISA 架構的中間表達和數(shù)據(jù)。Runtime 以 Compiler 生成的中間表達和數(shù)據(jù)為輸入,為用戶提供了豐富易用的開發(fā)接口以完成對底層 AI 芯片硬件的高效應用。
RainBuilder 使用過程非常簡單便捷,用戶無需對于底層硬件有深入的了解,即可快速開發(fā)適用于 AI 專用芯片的算法方案。從訓練好的模型文件,只需兩步,即可實現(xiàn)整個神經(jīng)網(wǎng)絡的推演。首先,調用 Compiler 的命令行接口完成模型的離線準備,對于一個模型,該步驟只需進行一次。Compiler 提供了一套端到端的優(yōu)化流程,包括模型解析、冗余節(jié)點裁剪、節(jié)點融合、模型量化壓縮等。之后用戶只需編寫針對特定算法的前后處理函數(shù),Runtime 會自動完成算法模型對于 CAISA 架構的高效調用。Runtime 中包含了大量針對 CAISA 架構的深層優(yōu)化,如硬件資源調配、運行時資源調度、軟硬件并行、異常處理等。另外,RainBuilder 通過支持用戶自定義算子實現(xiàn)了對于不同算法的高拓展性。用戶只需根據(jù)提供的接口即可完成自定義模塊的實現(xiàn),RainBuilder 會自動將自定義算子整合進計算圖中,并針對其特點完成相應的計算優(yōu)化。
提供下一代人工智能計算平臺,鯤云公布基于 CAISA 架構的系列 AI 產(chǎn)品,鯤云高性能 AI 芯片切入工業(yè)市場
會上,鯤云還公布了基于 CAISA 架構的一系列產(chǎn)品,包括針對前端和邊緣計算的“雨人”AI 芯片加速卡3代和應用于 NVR 和服務器的“星空”AI 加速卡2代,目前已經(jīng)在電力、安防、工業(yè)等領域實現(xiàn)了規(guī)模落地。同合作伙伴聯(lián)合開發(fā)的搭載雨人加速卡的 AI 攝像頭、智能無人機、智能 ops 系統(tǒng)盒子,搭載星空加速卡的兩款 AI 服務器也同時披露。
“雨人”加速卡可嵌入前端 IoTs 設備,提供深度學習目標定位、去重一體化前端方案,支持1080p 高清實時視頻對于60x60像素特定目標全檢測,具有50幀/秒的處理能力。
“星空”加速卡嵌入小型主機和服務器設備,即插即用,可同時支持16路1080p 視頻中對最小60×60像素的特定目標全檢測及視頻結構化分析,實現(xiàn)1080P 高清實時視頻200-800幀/秒的檢測性能,延時低至5毫秒,功耗為35w,實測性能達理論峰值的90%。充分體現(xiàn)了自主研發(fā)的定制數(shù)據(jù)流 CAISA 架構芯片高性能、低功耗、低延時的特性,最大化資源能效比??蔀榘卜佬袠I(yè)中交通、商場和住宅等場景數(shù)字安全監(jiān)控及行人、車輛、路況等提供深度學習目標定位、去重、識別、屬性分析一體化的邊緣后端人工智能加速方案。
鯤云高校計劃發(fā)布,聯(lián)合高校開展人工智能教學科研合作
為滿足高校日益增長的在人工智能領域教學培訓、科研平臺方面的需求,鯤云科技結合自身在人工智能芯片、開發(fā)平臺和垂直領域解決方案等方向的研發(fā)和技術優(yōu)勢,以及與市場端廣泛的互動關系,由鯤云人工智能應用創(chuàng)新研究院發(fā)起,鯤云正式發(fā)布鯤云高校計劃 CUP (Corerain University Program),與全球高校在人工智能課程、科研合作和國際交流等領域實現(xiàn)深度合作。
在課程方面,鯤云提供基于 CAISA 架構 FPGA 加速卡的人工智能課程及實驗內(nèi)容,支持高校相關課程升級;在科研方面,鯤云支持高?;?CAISA 架構運行最新人工智能算法,以及圍繞 CAISA 架構拓展硬件平臺;在國際合作領域,鯤云提供人工智能峰會、人工智能硬件加速暑期峰會等國際交流平臺,全方位支持與高校在 AI 領域的合作,加速最新 AI 技術的產(chǎn)學研合作。
2019年2月24日,鯤云高校計劃啟動,聯(lián)手英特爾開展的基于 Intel® FPGA 的人工智能芯片應用設計培訓的交流活動完美落幕,來自清華大學、武漢大學、華中科技大學、山東大學、天津大學、重慶大學、電子科技大學等近30所高校的40余位老師參加。除與 Intel 合作進行人工智能課程培訓外,鯤云人工智能應用創(chuàng)新研究院已同帝國理工學院、哈爾濱工業(yè)大學、天津大學等成立聯(lián)合實驗室,在定制計算、AI 芯片安全、工業(yè)智能等領域開展前沿研究合作。
高端會晤,國際 AI 領域權威分享人工智能前沿技術突破
作為年度重量級 AI 峰會,此次活動匯聚了政府領導、全球人工智能領域頂尖學術大師、世界頂級科技企業(yè)、互聯(lián)網(wǎng)巨頭,產(chǎn)業(yè)界、投資界行業(yè)領袖,共同探討人工智能實戰(zhàn)落地和產(chǎn)學研發(fā)展方向。整個峰會由政府致辭、主題演講和產(chǎn)業(yè)論壇三個環(huán)節(jié)組成。會上,幾位人工智能領域的國際權威,包括獲得“IT 諾貝爾獎”的 Viktor K. Prasanna 教授,IEEE 終身會士 Sun Yuan Kung(貢三元)教授,國際學術界公認的世界上極少數(shù)同時在數(shù)據(jù)庫理論與系統(tǒng)兩個領域做出突破性貢獻的 Wenfei Fan(樊文飛)院士,定制計算國際權威 Wayne Luk 陸永青院士,清華大學魏少軍教授,以及高性能計算領域的 Cristina Silvano 教授等院士嘉賓就計算加速技術在人工智能領域的落地應用、AI 方法的研究演進、面向人工智能應用的定制計算加速技術以及高能效高性能并行集群計算,軟件定義芯片等內(nèi)容做主題報告。
除了諸位院士、會士嘉賓的專業(yè)分享以外,Intel PSG 戰(zhàn)略市場總監(jiān)的 Tony Kau、浪潮人工智能與產(chǎn)品總經(jīng)理劉軍,也分享了英特爾和浪潮在人工智能的落地應用以及創(chuàng)新技術等方面的技術革新和新進展,也分享了同鯤云在 AI 加速應用和高校推廣等方面的深入合作。
此外,峰會還邀請到星瀚資本楊歌、雷鋒網(wǎng)麥廣煒、天津大學電子信息學院副院長劉強、JWIPC 副總經(jīng)理劉迪科、CCE-YOCSEF 深圳主席盧昱明等專家學者與鯤云科技 CTO 蔡權雄博士就人工智能芯片產(chǎn)業(yè)與生態(tài)落地等話題進行了探討。
2019年人工智能應用創(chuàng)新峰會順利結束,在未來計算架構的黃金十年,鯤云科技將憑借多年積累的數(shù)據(jù)流架構厚積薄發(fā),致力于在 AI 芯片性能上實現(xiàn)突破。
峰會照片:http://vphotos.cn/7Osk
峰會網(wǎng)站:http://www.corerain.com/summit2019