北京2015年10月13日電 /美通社/ -- 9月24日樂視在香港九龍東皇冠假日酒店舉行“王者歸來”發(fā)布會,正式推出樂視第三代超級電視。第三代超級電視擁有強(qiáng)大的智能電視交互能力,加入了遠(yuǎn)講場景語音功能,遠(yuǎn)講支持5米內(nèi)全向識別室內(nèi)聲音。模糊搜索智能匹配,說說話就能完全操控電視?!霸趺凑f都聽得懂”的樂視超級電視語音交互技術(shù)由國內(nèi)領(lǐng)先的人工智能及智能語音技術(shù)服務(wù)商云知聲獨家支持。
云知聲作為樂視電視語音交互技術(shù)的唯一提供商,從2013年5月樂視發(fā)布的第一代超級電視到近期的樂視第三代超級電視,從依賴遙控器或手機(jī)進(jìn)行語音操控到遠(yuǎn)講識別和全語音交互,持續(xù)不斷將最新的語音技術(shù)應(yīng)用落地,提升用戶體驗。超級語音2.0改變了什么?且聽云知聲細(xì)細(xì)道來。
擺脫遙控器和手機(jī)APP,樂視超級語音2.0的蛻變歷程
2013年,樂視超級電視在五棵松萬事達(dá)中心全球首發(fā),語音操控驚艷全場。樂視超級電視完全顛覆了傳統(tǒng)操作體驗,真正把互聯(lián)網(wǎng)和智能語音“植入”到電視里,不同于以往使用電視上那個足以令人崩潰的全鍵盤,用戶長按遙控器語音鍵,說出節(jié)目名,通過語音識別進(jìn)行搜索,一步到位,語音輸入徹底顛覆了傳統(tǒng)的選擇輸入的方式,讓電視進(jìn)入了全新的語音輸入時代。
在第一代超級電視上,語音交互操控除了使用電視遙控器外,云知聲為方便用戶操作還設(shè)計了多屏互動的交互體系,并推出了安卓系統(tǒng)和蘋果系統(tǒng)上的帶語音交互功能的手機(jī)遙控器。推出多屏互動之后,的確給予了一些手機(jī)使用者便捷,但是它地弊端也逐步開始顯現(xiàn)出來,就是用戶地使用成本太高了,用戶要先拿起手機(jī),點亮屏幕,密碼解鎖或者指紋解鎖,點擊打開應(yīng)用,再操作電視……每次重復(fù)如是繁瑣操作,一定程度上是再給用戶增加操作成本,并且使用多屏互動之前,還需要掃描屏幕二維碼,再下載應(yīng)用,再安裝,整個過程用戶的成本都變得非常高,語音操控要依賴遙控器或手機(jī)仍然無法稱作是最自然的人機(jī)交互。
科技源于生活,人機(jī)交互更多的也是參考實際的生活,最理想的語音交互,其實就是最常見的最普通的人與人之間的對話與溝通,現(xiàn)在的語音交互,乃至人機(jī)交互,都是在不斷地朝著這個目標(biāo)而努力。對于智能電視也是如此,如果能夠像人與人直接對話一樣,那將會是什么樣的一種體驗?zāi)??現(xiàn)有的語義的技術(shù),雖然無法達(dá)到像人與人那樣自由、智能地交流和溝通,但指令式的語音交互,已經(jīng)是游刃有余了,那為何不在“直接對話”上尋找突破口,大膽地問一句:“為什么電視一定需要遙控器呢?”
當(dāng)然,這是一個非常大膽地質(zhì)疑,一方面這是在挑戰(zhàn)一個根深蒂固的傳統(tǒng)的操作理念,另一方面,也是在挑戰(zhàn)一個全新的語音交互領(lǐng)域,作為超級電視的一個創(chuàng)新點,云知聲產(chǎn)品團(tuán)隊迎難而上,接受挑戰(zhàn)。第一個難題,便是降噪的問題,遠(yuǎn)講和近講的主要區(qū)別,是在于說話人和麥克風(fēng)之間的距離,當(dāng)距離越遠(yuǎn)時,環(huán)境噪音所帶來的影響,會直接導(dǎo)致識別率下降,所以,如何才能將環(huán)境的噪音去處掉,便是遠(yuǎn)講的第一個關(guān)鍵;第二個難題,是電視在播放時,所播出來的聲音會和主講人的聲音混合,如何才能將電視播放的聲音消除掉呢?第三個難題,是實際家庭環(huán)境的因素,其實就是混響問題,如何才能將混響的影響降到較低呢?問題已經(jīng)都提出了,接下來就是找尋方案了,進(jìn)入選擇意向的,便是麥克風(fēng)陣列方案,它有多個麥克風(fēng),形成一個陣列,根據(jù)不同麥克風(fēng)采集的聲音的各類數(shù)據(jù),來進(jìn)行說話人聲音的提取,云知聲遠(yuǎn)講超級語音技術(shù)讓用戶無需使用遙控器按下語音鍵才能語音操控,通過麥克風(fēng)陣列收集語音,經(jīng)過DSP處理模塊對聲音降噪,遠(yuǎn)講增強(qiáng)及回聲消除后清晰收音,電視可以全向識別室內(nèi)的聲音,當(dāng)你通過“暗號”(喚醒詞)激活語音功能后,它將識別到你的聲音并且根據(jù)指令進(jìn)行開關(guān)機(jī)、資源點播等等。同時支持自定義喚醒詞,用戶可以坐在沙發(fā)上對著電視說“樂樂,我要看《捉妖記》”,電視喚醒后,用戶便能在電視端看到相關(guān)視頻。
喚醒僅僅是超級語音2.0的一個開始,超級語音2.0的全語音交互實現(xiàn)了凡是在UI界面中所能見的,皆為語音所能控制的;在電視上所能用的,皆為語音所能操作的。從開機(jī),到關(guān)機(jī),從語音搜索,到語音控制,從語音助手應(yīng)用,到系統(tǒng)應(yīng)用,甚至到第三方應(yīng)用,都需要支持語音交互。云知聲經(jīng)過半年多的努力通過熱喚醒+語音識別+連續(xù)識別+連貫任務(wù)最終將全語音交互完美落地,讓用戶怎么說都聽得懂,徹底擺脫遙控器。
云知聲發(fā)力語音交互入口背后,意在人工智能助理
非智能電視時代當(dāng)我們打開電視時,看到的就只是電視臺按每天既定的節(jié)目表播放的電視節(jié)目,不會出現(xiàn)一個主頁面,也不會有那么多圖標(biāo)點來點去,人們只在乎打開電視馬上就能看到什么。而智能電視時代,電視提供給用戶的內(nèi)容越來越多,越來越雜。語音功能作為電視介入互聯(lián)網(wǎng)搜索的方式之一,對人工智能的要求非常高,語言是人類獨有的文明傳播方式,要讓電腦理解它浩大的語境語義,難度非常之高。此次樂視超級語音2.0支持語音開機(jī)、個性化喚醒,其場景化的語音控制使命令更準(zhǔn)確,使用范圍更廣,支持多關(guān)鍵詞模糊搜索、連貫任務(wù)執(zhí)行,讓用戶徹底擺脫遙控器。表面上是用戶的交互方式的改變,換一個角度看,將語音當(dāng)作用戶使用習(xí)慣的收集工具,將大數(shù)據(jù)統(tǒng)計處理,用語音連接人和信息,語音連接人和服務(wù),這也是云知聲希望通過語音來為用戶做的更多。
試想一下,在智能電視上所有軟件都放在另外一個界面里,當(dāng)累了一整天不愿意動彈,回家就想看點自己喜歡的節(jié)目打發(fā)時間,如果只需要對著電視說“電視開機(jī)”它就能自動跳轉(zhuǎn)到你喜歡的電視節(jié)目中,那該是多么愜意。此外,基于聲紋識別記錄說話人信息,分析家庭不同成員觀片喜好,在喚醒電視后自動提醒播放電視節(jié)目或游戲節(jié)目,甚至提供菜譜指導(dǎo)、親子游戲、體育節(jié)目等各種內(nèi)容。而視頻的搜索播放是電視中最為常見的功能之一,全語音的交互體驗,不僅僅在視頻搜索上,在頻道切換、節(jié)目單查詢、預(yù)約提醒等等功能服務(wù)商,都是可以體現(xiàn)的,而且通過遠(yuǎn)講技術(shù)的使用,全語音交互成為了不可或缺的交互基礎(chǔ)。
2012年以黑馬之姿殺入語音行業(yè)的云知聲,如今已在人工智能領(lǐng)域多點開花,成績斐然。云知聲“云·端·芯”超智能方程式已在智能家居、智能車載、在線教育、云平臺等行業(yè)廣泛應(yīng)用,隨著大數(shù)據(jù),云計算,人工智能等技術(shù)的發(fā)展,在萬物智能時代,所有的有東西都將會是智能的,無論是汽車,電視,電飯煲,冰箱還是路燈。這些智能的萬物,都具有不同層次的智能,都覺有不同的學(xué)習(xí)能力。這些設(shè)備都可以與人做基于語音的自然交互,甚至這些設(shè)備之間也可以自動交換信息。目前云知聲正在向萬物智能的目標(biāo)而努力,云知聲已推出面向智能家居、智能車載的產(chǎn)品應(yīng)用系統(tǒng)包括智能電視、音箱、空調(diào)、語音后視鏡、智能語控車機(jī)等產(chǎn)品,這些產(chǎn)品通過語音命令進(jìn)行控制,可以完全擺脫了對遙控器和手機(jī)APP的依賴。云知聲以語音交互為入口,結(jié)合大數(shù)據(jù)、云計算、人工智能,為用戶提供更精準(zhǔn)的消費、社交行為推薦,打造家庭人工智能助理。在智能家居平臺真正開啟未來的全語音生態(tài)。
圖標(biāo) - http://photos.prnasia.com/prnh/20140807/0861405546