墨爾本2019年2月18日電 /美通社/ -- 2月15日,在澳大利亞墨爾本圓滿閉幕的第12屆網(wǎng)絡(luò)搜索與數(shù)據(jù)挖掘國(guó)際會(huì)議(WSDM 2019)上,臥龍大數(shù)據(jù)AI團(tuán)隊(duì)陳維龍獲得 WSDM Cup 挑戰(zhàn)賽第一名的成績(jī),這是中國(guó)企業(yè)參賽者首次在該賽事上取得的最高名次(去年WSDM 2018大賽上阿里AliOS 算法團(tuán)隊(duì)獲得第二名)。
WSDM 被譽(yù)為信息檢索領(lǐng)域頂級(jí)的會(huì)議之一,會(huì)議的關(guān)注點(diǎn)為搜索、數(shù)據(jù)檢索、數(shù)據(jù)挖掘、算法設(shè)計(jì)、算法分析、經(jīng)濟(jì)影響方面的實(shí)際且嚴(yán)謹(jǐn)?shù)难芯?,以及?duì)準(zhǔn)確率和運(yùn)行速度的深入實(shí)驗(yàn)探究,今年已經(jīng)是 WSDM 的第十二屆會(huì)議。
本次 WSDM Cup 有來(lái)自全球 744 支隊(duì)伍參賽,論文接收率約為16%。此次比賽的賽題內(nèi)容是預(yù)測(cè)短視頻APP應(yīng)用在用戶快速增長(zhǎng)階段中的用戶留存率,從而進(jìn)一步挖掘提高用戶留存率及影響用戶留存的原因。
臥龍大數(shù)據(jù)陳維龍?jiān)O(shè)計(jì)了一種實(shí)用的機(jī)器學(xué)習(xí)方法來(lái)應(yīng)對(duì)這樣的挑戰(zhàn),包括特征工程、Lightgbm、CatBoost等決策樹方法,RNN-ManyToMany等深度學(xué)習(xí)的方法,以及學(xué)習(xí)模型的堆疊。決策樹對(duì)于特征工程的挖掘具有非常好的效果體現(xiàn),而RNN-ManyToMany相對(duì)于傳統(tǒng)方式,不需要過多地處理輸入序列,可以直接輸入各種行為序列。通過余弦退火快照集成,從而以非常低的成本獲得大量不同的局部最優(yōu)值。通過多次優(yōu)化完善,陳維龍最終算法組件和可解釋性組件綜合得分第一,取得冠軍。
在此之前,臥龍大數(shù)據(jù)已經(jīng)深度研究過該類問題并制定了解決方案,去年臥龍大數(shù)據(jù)就已經(jīng)和本地運(yùn)營(yíng)商合作,建模研究運(yùn)營(yíng)商在網(wǎng)用戶的離網(wǎng)概率和離網(wǎng)原因,最終獲得了極高的準(zhǔn)確率,并將之拓展應(yīng)用到運(yùn)營(yíng)商、金融等多個(gè)領(lǐng)域的用戶分析研究之中。