omniture

讓數(shù)據(jù)活起來--七牛數(shù)據(jù)峰會側記

2015-09-02 10:44 7262

上海2015年9月2日電 /美通社/ -- 經(jīng)常有朋友問,免費的生意到底是怎么玩的?團購這種“站在跟前打折”的做法沒有貓膩嗎?每次我解釋完這類問題,常會有人感嘆說:好精明。是的,傳統(tǒng)上說做這種生意的人必須“心眼多”、“會算”。但換個角度看,“精明”和“心眼多”并不是獨特的天賦,說到底無非是“駕馭數(shù)據(jù)的能力”而已。如果說過去駕馭數(shù)據(jù)很大程度上需要依賴聰明才智,那么現(xiàn)在依靠技術的發(fā)展,駕馭數(shù)據(jù)的門檻已經(jīng)大大降低了,進入“大數(shù)據(jù)”時代之后,這一點應該體現(xiàn)得更加明顯。

D-Future 數(shù)據(jù)重構未來 -- 七牛·數(shù)據(jù)時代峰會
D-Future 數(shù)據(jù)重構未來 -- 七牛·數(shù)據(jù)時代峰會

不得不承認,大數(shù)據(jù)已經(jīng)成了熱門的詞匯,仿佛一夜之間,我們就進入了大數(shù)據(jù)時代,處理數(shù)據(jù)的各種限制和困難都不復存在了。隨之而來的,大家駕馭數(shù)據(jù)的能力都應該突飛猛進,玩轉數(shù)據(jù)再也不是什么難事。但是,事實真的如此嗎?

不幸的是,現(xiàn)在很多所謂的大數(shù)據(jù),只有量的積累,沒有質的提升,只有規(guī)模的增長,沒有價值的飛躍。依靠迅速提升的存儲能力,我們可以保存幾乎無限的數(shù)據(jù)。但是大家能從數(shù)據(jù)里挖掘出來多少內容?看來看去,似乎還只是原先的那些指標,充其量是能更快得到結果而已。這就是我們想要的大數(shù)據(jù)嗎?如果不是,真正的大數(shù)據(jù)應該怎樣玩?

要回答這個問題,可以去閱讀各種和大數(shù)據(jù)相關的書籍,得到一大堆經(jīng)典例子,也可以聽聽在每天與數(shù)據(jù)打交道的先行者們的說法,傾聽來自第一線的感悟。第一種方式很容易實現(xiàn),第二種方式則更講機緣 -- 所以,8月29日七牛云存儲在上海舉行的 D-Future 數(shù)據(jù)重構未來的大會,就尤其值得參加了。這次大會不叫“技術大會”而叫“數(shù)據(jù)大會”,因為它是名副其實的,尤其是兩位演講嘉賓許式偉(老許,七牛CEO)和李道兵(道哥,七牛首席架構師),都是我以前的同事,是有多年開發(fā)經(jīng)驗、技術非常純熟的高手,但他們分享的內容不是技術,而是數(shù)據(jù)以及他們與數(shù)據(jù)打交道的心得,在我看來這些觀點是非常有價值的。

老許的第一個觀點是,很多人還沒有為大數(shù)據(jù)做好準備,最明顯的,還有很多公司仍然在定期清理日志。存儲容量在大數(shù)據(jù)時代已經(jīng)不再重要,所以存儲日志并沒有嚴格的容量限制。即便是看來簡單的日志,也包含了足夠多的數(shù)據(jù),只是尚未挖掘出足夠的價值。這個觀點被之后的演講嘉賓,《大數(shù)據(jù)時代》的作者牛津大學教授舍恩伯格推進了一步:傳統(tǒng)觀念里大家把數(shù)據(jù)視作成本,為了某個目的(或者假設),精打細算地收集數(shù)據(jù),分析得出結論。但是到了大數(shù)據(jù)時代,因為容量不再是問題,所以數(shù)據(jù)的角色從成本變成了環(huán)境,很多探索也變?yōu)閺摹盁o目的”收集的海量數(shù)據(jù)中提煉價值的過程。所以在大數(shù)據(jù)時代,背靠云服務提供商,大家都應當在頭腦里把“容量”和“成本”解綁,改換全新的思維方式。

老許的另一個觀點我也非常贊同,即“非結構化數(shù)據(jù)”是未來的重要發(fā)展方向。長期以來,有很多技術人員 -- 包括我在內 -- 望世間萬物都是規(guī)范嚴謹、邏輯清晰的,就好像柏拉圖那純凈的理念世界。然而真實的世界里總是充滿了噪音、變異、錯誤,于是大家需要做大量的規(guī)范和清洗,而且免不了抱怨連天。近幾年我逐漸想到,或許我們不應該簡單把不規(guī)范的世界肢解后硬塞到規(guī)范的世界里,而應該用更高明的辦法來駕馭不規(guī)范的世界;不應當強求接收的數(shù)據(jù)都是結構化的,而應當努力適應各種非結構化的數(shù)據(jù)。我的遐想在老許那里變成了扎實的結論,老許的演講里提供了不少關于音頻、視頻等非結構化數(shù)據(jù)的巧妙應用,充分說明了這種思路的價值。

如果說老許的演講更側重于大數(shù)據(jù)的的方面,那么之后道哥的分享更側重于的方面,也就是通過把數(shù)據(jù)真正盤活?,F(xiàn)在很多的云服務都側重存儲和計算,而忽略了真正的應用,云服務更習慣扮演簡單的“保險箱”,不去關心箱子里到底裝了什么,能挖掘出什么價值。相應的,很多的應用開發(fā)商也只把云服務當“保險箱”來用,所有的應用都由自己來動手。

比如對于常見的視頻類應用,無論是 SNS 中流行的秒拍,還是安防領域熱門的視頻監(jiān)控,其背后的要求和邏輯是有很多共性的。但是長期以來市場上并沒有這種數(shù)據(jù)+應用的解決方案,所以即便有云服務,應用的開發(fā)團隊還是需要花費大量的精力來做鑒權、轉碼、分發(fā)、直播等業(yè)務。

造成這種現(xiàn)象的重要原因是云服務時代的脫節(jié):網(wǎng)絡上現(xiàn)成的類庫往往側重于功能,在單機來做相當簡單,但是云環(huán)境下的玩法不同于單機,所以把單純的功能變成云服務環(huán)境下的應用就成了相當有挑戰(zhàn)的工作。結果,應用開發(fā)商自己來包裝卻事倍功半,或者云服務提供商提供了一些功能,但往往失之簡單,無法與應用深度結合。結果就是功能和云服務融合不起來,總有功虧一簣的遺憾。

如果云服務提供商能深入理解各種應用,把通用服務抽象出來并以云服務組件的方式提供,就能實現(xiàn)云服務提供商和應用開發(fā)商的雙贏。如果要給云服務打分的話,數(shù)據(jù)的存儲和簡單處理就像是1,各種包裝好的應用組件就像是0,有多少種應用組件,1后面就有多少個0,效能就可以增加多少個數(shù)量級。從道哥給出的例子來看,七牛顯然已經(jīng)找到了不小的想象空間。

老許和道哥關于數(shù)據(jù)的“動靜結合”的講解,我不由得想起以前看過的一本書,《硬球:政治是這樣玩的》,因為本次大會的介紹的方案,分享的經(jīng)驗,都在宣示“數(shù)據(jù)是這樣玩的”,讓大家看到數(shù)據(jù)的真正玩法,刷新大家對數(shù)據(jù)的認識。

不過我也需要承認,聽完整場大會,長期以來我的疑惑還是沒有得到解答。

如何確?!按髷?shù)據(jù)”真正反映了現(xiàn)實,讓我們能基于此認識世界呢?

我們當然可以收集海量的、非結構化的數(shù)據(jù),但現(xiàn)實世界高度復雜的,在應對大數(shù)據(jù)時,我們如何才能證明在我們構建的“數(shù)據(jù)世界”里已經(jīng)包括了足夠的數(shù)據(jù)?比如要分析人的某人運動模式,我們當然需要收集人的運動軌跡,除了常見的經(jīng)緯度和速度,是否還需要關心高度、溫度、濕度、心跳等等信息?如果某項信息,比如血壓,與我們關心的內容或規(guī)律密切相關而又沒有被收集進來,即便有了海量數(shù)據(jù),有了超強的數(shù)據(jù)分析能力,我們是否仍然會茫然無緒?退一步說,如果這些數(shù)據(jù)已經(jīng)收集了,但結構不同,分布不同,歸屬不同,我們應該如何把這些數(shù)據(jù)串通融合起來,真正發(fā)現(xiàn)其中的規(guī)律?

這些問題我沒有答案,我也認為暫時不可能有答案。因為解答這類問題,不再依賴單純的思辨和邏輯的推理,而是更多需要依靠扎扎實實的探索,尤其需要大量有聰明才智和深厚積累的人才的持續(xù)投入。我能夠確認的是,在這次的數(shù)據(jù)大會上,我看到了未來的希望。(作者:余晟)

圖片 - http://photos.prnasia.com/prnh/20150902/0861508214

消息來源:七牛云存儲
China-PRNewsire-300-300.png
全球TMT
微信公眾號“全球TMT”發(fā)布全球互聯(lián)網(wǎng)、科技、媒體、通訊企業(yè)的經(jīng)營動態(tài)、財報信息、企業(yè)并購消息。掃描二維碼,立即訂閱!
collection