omniture

捷通華聲推出靈云多語種OCR識別

2014-08-29 14:28

  近日,捷通華聲宣布靈云智能開放平臺(hcicloud.ocm)多語種OCR識別能力服務進入試運營階段,開始提供包括中文、英文、德文、法文、俄文、西班牙文、意大利文等十幾個國家語言文字的自動識別服務。此次靈云多語種OCR能力的發(fā)布,也是繼靈云平臺推出13種語言的靈云語音合成、93種語言的靈云手寫識別技術能力之后,靈云平臺服務多國語言方面所取得的最新進展。

  作為中國人工智能領域的領軍企業(yè),捷通華聲自2000年開始堅持自主研究智能語音、圖像等人工智能技術,并不斷在OCR、手寫識別等智能圖像技術領域取得突破。近年來,靈云OCR在掃描識別領域異軍突起,以接近100%的中英文識別率和優(yōu)質(zhì)的版面分析能力獲得了產(chǎn)業(yè)內(nèi)廣大用戶的認可,為企業(yè)大幅減少了人工文字錄入工作量、提高了文檔編輯和搜索的效率。伴隨經(jīng)濟全球化的進展,人工智能技術在多語言環(huán)境中的應用需求越來越迫切。捷通華聲順應產(chǎn)業(yè)發(fā)展趨勢,在加大多語言人工智能技術研究的基礎上,依托靈云智能開放平臺以開放、合作、共贏的戰(zhàn)略發(fā)展思路,與國內(nèi)外頂尖人工智能研究機構(gòu)、企業(yè)開展廣泛合作,全面為中國企業(yè)提供多語言人工智能技術能力服務。此次上線的多語種OCR,可以幫助企業(yè)與廣大用戶將德文、法文、俄文、西班牙文、意大利文等不同國家語言的文件、書籍、報紙、雜志等檔案數(shù)字化,生成便于傳輸和管理的PDF文件,將有力促進國內(nèi)企業(yè)參與國際交流。

  自靈云智能開放平臺(hcicloud.ocm)2011年推出靈云OCR以來,不僅面向廣大用戶提供直接文字識別服務,同時針對金融,能源,交通,政府,企業(yè)等領域企業(yè)戶提供定制化服務。靈云OCR通過匹配圖像中的關鍵信息來自動確認圖像種類,獲得更加準確的識別結(jié)果。目前靈云OCR已實現(xiàn)對身份證,駕駛證、行駛證、增值稅發(fā)票,銀行卡號、名片等各類證照、票據(jù)、表單的識別。針對特殊需求,靈云OCR還可以提供特殊定制功能,針對用戶的圖像種類進行模板定制,實現(xiàn)“一種核心,多類圖像”的應用效果,尤其是在各大銀行,證劵、保險公司,能源、電信、醫(yī)療、政府等辦公營業(yè)廳的應用中,已成功實現(xiàn)人證統(tǒng)一、票據(jù)電子化、無紙化辦公等功能,極大節(jié)省了大眾用戶辦理業(yè)務的等待時間,也極大節(jié)省了企業(yè)業(yè)務成本,提高了辦公效率,并通過減少大量復印以符合綠色環(huán)保辦公的新趨勢。

  靈云OCR支持掃描儀、手機、照相機、攝像機、高拍儀等各種圖像掃描、拍照設備,并兼容市場的主流業(yè)務系統(tǒng)。在各種系統(tǒng)應用中,靈云OCR在確保原業(yè)務系統(tǒng)穩(wěn)定性和安全性的同時,也可借助自學習功能不斷豐富字符/圖像特征庫,從而提高自身在識別時對圖像的適應能力。除了企事業(yè)辦公以外,人們生活的方方面面也因靈云OCR技術的廣泛應用而更加的生動有趣。目前,用戶已經(jīng)可以用手機、數(shù)碼相機或DV拍照名片等紙質(zhì)資料,并利用靈云OCR軟件識別轉(zhuǎn)換成可編輯的電子資料??梢韵胂?,日后靈云OCR的應用場景將會越來越廣泛,使用也將會越來越便捷。

  靈云平臺此次推出多語種OCR也標示著靈云平臺在實施面向國際、全面提供人工智能服務戰(zhàn)略規(guī)劃中,完成了第三步重要舉措。作為國內(nèi)唯一全方位人工智能云服務開放平臺,靈云平臺囊括了語音合成(TTS)、語音識別(ASR)、手寫識別(HWR)、光學字符識別(OCR)、自然語言理解(NLU)以及機器翻譯(MT)等多項人工智能能力,全方位賦予計算機思維和感官能力,使人與機器的溝通更加簡單自然。2012年,靈云平臺在手寫識別領域邁出了國際化道路上第一步:推出覆蓋全球92種語言的靈云手寫識別技術,此舉標志著我國手寫識別技術已經(jīng)達到國際領先水平!2013年,靈云平臺繼提供中文普通話、粵語、維吾爾語、英語服務之后,開始提供德語、法語、日語、韓語等13種語言的靈云語音合成技術,為需要多國語言服務的中國企業(yè)提供了最豐富、最有力的智能語音能力支撐,邁出了靈云智能開放平臺助力中國企業(yè)開拓國際市場、支持參與國際競爭的跨越之步。

  捷通華聲在全面推動中國人工智能產(chǎn)業(yè)發(fā)展的進程中,靈云平臺得到了清華大學的鼎力支持。捷通華聲與清華大學人工智能重點實驗室在圖像識別、語音交互、語義理解等人工智能技術領域全面展開合作,在不斷完善OCR多樣化應用的同時,也在為研發(fā)更豐富的圖像識別技術而努力,并將很快推出人臉識別等更多元化的圖像識別技術,保證靈云平臺擁有更加全面的“視覺與感觀”能力。

  靈云智能開放平臺(hcicloud.ocm)自2011年推出以來,已經(jīng)為金融、電信、醫(yī)療、交通、能源、教育、醫(yī)療、政府等各個領域的用戶提供人工智能技術服務,并以“云+端”的服務方式為百度導航、搜狗地圖、京東商城、網(wǎng)易有道、滴滴打車、天行聽書、天行輸入法等數(shù)千款移動應用提供支持,為超過3億社會大眾提供服務。此次靈云多語種OCR的推出將進一步加強靈云與企業(yè)間的合作,為中國企業(yè)向國際化拓展提供更為有力的支持。未來發(fā)展,捷通華聲靈云平臺將在發(fā)揮靈云OCR等智能技術優(yōu)勢的基礎上加強與清華大學深度合作,不斷推出識別率更高、更寬廣的智能圖像識別技術與解決方案,為廣大企業(yè)與用戶提供人工智能技術服務,共同實現(xiàn)“靈云科技 源自清華 服務全球”的戰(zhàn)略發(fā)展規(guī)劃!

消息來源:CTI論壇