omniture

微軟研究院聯(lián)手維基百科增強多語言內(nèi)容

2010-10-18 13:59 4091

WikiBhasha 工具將有助簡化并加速維基百科多語言內(nèi)容的創(chuàng)建流程

華盛頓州雷蒙德2010年10月18日電 /美通社亞洲/ -- 微軟研究院 (Microsoft Research) 今天宣布推出 WikiBhasha 的公開測試版。WikiBhasha 是一款面向維基百科 (Wikipedia) 的多語言內(nèi)容創(chuàng)建工具,它使維基百科的貢獻者可以從其他維基百科文章中找到相關內(nèi)容,并將這些內(nèi)容翻譯成其它語言,從而整理成新的文章或對多語言維基百科上的現(xiàn)有文章進行補充。WikiBhasha 的公開測試版將作為一款基于 Apache License 2.0 的開源 MediaWiki 擴展功能 (http://svn.wikimedia.org/viewvc/mediawiki/trunk/extensions/WikiBhasha) 和一款維基百科用戶工具來使用,它還可用作一款可安裝的小書簽 (http://www.wikibhasha.org),由微軟公司的 Windows Azure 平臺提供托管服務。WikiBhasha 這個名字來源于大家熟悉的專用詞語“wiki”(提倡共同創(chuàng)作)和“bhasha”(在印度語和梵語中的意思是“語言”)。

(圖標:http://photos.prnewswire.com/prnh/20000822/MSFTLOGO

(圖標:http://www.newscom.com/cgi-bin/prnh/20000822/MSFTLOGO

WikiBhasha 將支持三十多種語言的內(nèi)容創(chuàng)建。其公開測試版將利用海量英語版維基百科內(nèi)容作為信息源,簡化非英語維基百科的內(nèi)容創(chuàng)建。最初,維基媒體基金會 (Wikimedia Foundation) 和微軟研究院將與維基百科用戶社區(qū)密切合作,致力于阿拉伯語、德語、印度語、日語、葡萄牙語和西班牙語的內(nèi)容創(chuàng)建。

維基媒體基金會首席技術官 Danese Cooper 表示:“我們一直樂于看到維基多語言合作的不斷增強。微軟研究院正在從事 WikiBhasha 方面的一些有趣的工作,我們對它選擇分享自己的開源客戶代碼感到非常高興?!?/p>

通過讓維基百科社區(qū)更方便容易地創(chuàng)建多語言內(nèi)容,維基百科和微軟研究院希望掀起新一波的多語言內(nèi)容創(chuàng)建浪潮。

微軟印度研究院董事總經(jīng)理 P. Anandan 表示:“WikiBhasha 公開測試版繼續(xù)履行簡化多語言內(nèi)容創(chuàng)建和產(chǎn)生大量平行語言數(shù)據(jù)供研究人員推進機器翻譯技術的承諾。在維基百科社區(qū)的積極參與下,多語言高品質內(nèi)容的創(chuàng)建工作將得到大大改善,速度也將加快?!?/p>

WikiBhasha 公開測試版是一個致力于維基百科網(wǎng)站的基于瀏覽器的工具。其簡單直觀的用戶界面 (UI) 層支持目標語言維基百科內(nèi)容創(chuàng)建的整個流程,并將內(nèi)容發(fā)現(xiàn)功能與語言和協(xié)作服務相結合,使用戶將精力主要放在目標維基百科的內(nèi)容創(chuàng)建上。在一個簡單的三步流程的引導下,用戶可以對內(nèi)容進行搜索,接著從英語版維基百科文章中收集信息,并整理成當?shù)卣Z言版本的維基百科文章,最終將其發(fā)布到目標維基百科上。盡管一個普通會話可改進目標語言維基百科文章,但新文章的創(chuàng)建也可按照一個相似的流程來進行。WikiBhasha 公開測試版目前支持在安裝在 Windows XP、Windows Vista 和 Windows 7 上的 Windows Internet Explorer (7.0和8.0) 以及安裝在 Linux Fedora (11和12)、Windows XP、Windows Vista 及 Windows 7 上的 Firefox (3.5 或以上版本) 上運行。

微軟的機器翻譯系統(tǒng)和微軟的協(xié)作翻譯框架 (Collaborative Translations Framework) 支持的 WikiBhasha 已被微軟印度研究院(http://research.microsoft.com/en-us/labs/india/) 的多語言系統(tǒng) (http://research.microsoft.com/en-us/groups/mls/) 小組概念化。這個多語言系統(tǒng)小組致力于開發(fā)多語言和跨語言技術,以實現(xiàn)語言間的無縫轉換和計算機語言研究輔助資源的創(chuàng)建。微軟雷蒙德研究院的自然語言處理小組也參與了這款工具的開發(fā)。

欲了解 WikiBhasha 公開測試版的豐富功能,請訪問:http://www.wikibhasha.org 觀看相關視頻教材。

微軟研究院簡介

微軟研究院成立于1991年,專注于計算機科學和軟件工程領域的基礎和應用研究。研究人員關注著55多個計算細分行業(yè),并與領先的學術、政府和行業(yè)研究人員合作,共同促進先進技術的推廣。微軟研究院這些年來已延伸到全球8個地方,并提出了眾多合作項目,攬聚了大批計算機科學行業(yè)的人才精英,并在這些人的卓越才華和興趣的引導下推進研究議程。

微軟研究院在華盛頓州雷蒙德、馬薩諸塞州劍橋、加州硅谷、英國劍橋、中國北京和印度班加羅爾設有分部,并在埃及的開羅微軟創(chuàng)新中心、德國亞琛的歐洲微軟創(chuàng)新中心以及雷蒙德的 eXtreme Computing Group 開展研究工作。微軟研究院與全球學院和大學公開合作,共同增強教學體驗,鼓勵技術創(chuàng)新,并廣泛推進計算機科學行業(yè)。詳情請登錄:http://www.research.microsoft.com。

微軟簡介

微軟 (Nasdaq: MSFT) 成立于1975年,是幫助個人和企業(yè)發(fā)揮較大潛能的軟件、服務和解決方案的全球領先供應商。

消息來源:微軟公司
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection