上海2015年9月2日電 /美通社/ -- 經(jīng)常有朋友問(wèn),免費(fèi)的生意到底是怎么玩的?團(tuán)購(gòu)這種“站在跟前打折”的做法沒(méi)有貓膩嗎?每次我解釋完這類(lèi)問(wèn)題,常會(huì)有人感嘆說(shuō):好精明。是的,傳統(tǒng)上說(shuō)做這種生意的人必須“心眼多”、“會(huì)算”。但換個(gè)角度看,“精明”和“心眼多”并不是獨(dú)特的天賦,說(shuō)到底無(wú)非是“駕馭數(shù)據(jù)的能力”而已。如果說(shuō)過(guò)去駕馭數(shù)據(jù)很大程度上需要依賴(lài)聰明才智,那么現(xiàn)在依靠技術(shù)的發(fā)展,駕馭數(shù)據(jù)的門(mén)檻已經(jīng)大大降低了,進(jìn)入“大數(shù)據(jù)”時(shí)代之后,這一點(diǎn)應(yīng)該體現(xiàn)得更加明顯。
不得不承認(rèn),“大數(shù)據(jù)”已經(jīng)成了熱門(mén)的詞匯,仿佛一夜之間,我們就進(jìn)入了“大數(shù)據(jù)”時(shí)代,處理數(shù)據(jù)的各種限制和困難都不復(fù)存在了。隨之而來(lái)的,大家駕馭數(shù)據(jù)的能力都應(yīng)該突飛猛進(jìn),玩轉(zhuǎn)數(shù)據(jù)再也不是什么難事。但是,事實(shí)真的如此嗎?
不幸的是,現(xiàn)在很多所謂的“大數(shù)據(jù)”,只有量的積累,沒(méi)有質(zhì)的提升,只有規(guī)模的增長(zhǎng),沒(méi)有價(jià)值的飛躍。依靠迅速提升的存儲(chǔ)能力,我們可以保存幾乎無(wú)限的數(shù)據(jù)。但是大家能從數(shù)據(jù)里挖掘出來(lái)多少內(nèi)容?看來(lái)看去,似乎還只是原先的那些指標(biāo),充其量是能更快得到結(jié)果而已。這就是我們想要的“大數(shù)據(jù)”嗎?如果不是,真正的“大數(shù)據(jù)”應(yīng)該怎樣玩?
要回答這個(gè)問(wèn)題,可以去閱讀各種和“大數(shù)據(jù)”相關(guān)的書(shū)籍,得到一大堆“經(jīng)典”例子,也可以聽(tīng)聽(tīng)在每天與數(shù)據(jù)打交道的先行者們的說(shuō)法,傾聽(tīng)來(lái)自第一線的感悟。第一種方式很容易實(shí)現(xiàn),第二種方式則更講機(jī)緣 -- 所以,8月29日七牛云存儲(chǔ)在上海舉行的 D-Future “數(shù)據(jù)重構(gòu)未來(lái)”的大會(huì),就尤其值得參加了。這次大會(huì)不叫“技術(shù)大會(huì)”而叫“數(shù)據(jù)大會(huì)”,因?yàn)樗敲逼鋵?shí)的,尤其是兩位演講嘉賓許式偉(老許,七牛CEO)和李道兵(道哥,七牛首席架構(gòu)師),都是我以前的同事,是有多年開(kāi)發(fā)經(jīng)驗(yàn)、技術(shù)非常純熟的高手,但他們分享的內(nèi)容不是技術(shù),而是數(shù)據(jù)以及他們與數(shù)據(jù)打交道的心得,在我看來(lái)這些觀點(diǎn)是非常有價(jià)值的。
老許的第一個(gè)觀點(diǎn)是,很多人還沒(méi)有為大數(shù)據(jù)做好準(zhǔn)備,最明顯的,還有很多公司仍然在定期清理日志。存儲(chǔ)容量在大數(shù)據(jù)時(shí)代已經(jīng)不再重要,所以“存儲(chǔ)日志”并沒(méi)有嚴(yán)格的容量限制。即便是看來(lái)簡(jiǎn)單的日志,也包含了足夠多的數(shù)據(jù),只是尚未挖掘出足夠的價(jià)值。這個(gè)觀點(diǎn)被之后的演講嘉賓,《大數(shù)據(jù)時(shí)代》的作者牛津大學(xué)教授舍恩伯格推進(jìn)了一步:傳統(tǒng)觀念里大家把數(shù)據(jù)視作成本,為了某個(gè)目的(或者假設(shè)),精打細(xì)算地收集數(shù)據(jù),分析得出結(jié)論。但是到了大數(shù)據(jù)時(shí)代,因?yàn)槿萘坎辉偈菃?wèn)題,所以數(shù)據(jù)的角色從成本變成了環(huán)境,很多探索也變?yōu)閺摹盁o(wú)目的”收集的海量數(shù)據(jù)中提煉價(jià)值的過(guò)程。所以在大數(shù)據(jù)時(shí)代,背靠云服務(wù)提供商,大家都應(yīng)當(dāng)在頭腦里把“容量”和“成本”解綁,改換全新的思維方式。
老許的另一個(gè)觀點(diǎn)我也非常贊同,即“非結(jié)構(gòu)化數(shù)據(jù)”是未來(lái)的重要發(fā)展方向。長(zhǎng)期以來(lái),有很多技術(shù)人員 -- 包括我在內(nèi) -- 望世間萬(wàn)物都是規(guī)范嚴(yán)謹(jǐn)、邏輯清晰的,就好像柏拉圖那純凈的理念世界。然而真實(shí)的世界里總是充滿了噪音、變異、錯(cuò)誤,于是大家需要做大量的規(guī)范和清洗,而且免不了抱怨連天。近幾年我逐漸想到,或許我們不應(yīng)該簡(jiǎn)單把不規(guī)范的世界肢解后硬塞到規(guī)范的世界里,而應(yīng)該用更高明的辦法來(lái)駕馭不規(guī)范的世界;不應(yīng)當(dāng)強(qiáng)求接收的數(shù)據(jù)都是“結(jié)構(gòu)化”的,而應(yīng)當(dāng)努力適應(yīng)各種非結(jié)構(gòu)化的數(shù)據(jù)。我的遐想在老許那里變成了扎實(shí)的結(jié)論,老許的演講里提供了不少關(guān)于音頻、視頻等“非結(jié)構(gòu)化數(shù)據(jù)”的巧妙應(yīng)用,充分說(shuō)明了這種思路的價(jià)值。
如果說(shuō)老許的演講更側(cè)重于大數(shù)據(jù)的“靜”的方面,那么之后道哥的分享更側(cè)重于“動(dòng)”的方面,也就是通過(guò)把數(shù)據(jù)真正盤(pán)活?,F(xiàn)在很多的云服務(wù)都側(cè)重存儲(chǔ)和計(jì)算,而忽略了真正的應(yīng)用,云服務(wù)更習(xí)慣扮演簡(jiǎn)單的“保險(xiǎn)箱”,不去關(guān)心箱子里到底裝了什么,能挖掘出什么價(jià)值。相應(yīng)的,很多的應(yīng)用開(kāi)發(fā)商也只把云服務(wù)當(dāng)“保險(xiǎn)箱”來(lái)用,所有的應(yīng)用都由自己來(lái)動(dòng)手。
比如對(duì)于常見(jiàn)的視頻類(lèi)應(yīng)用,無(wú)論是 SNS 中流行的秒拍,還是安防領(lǐng)域熱門(mén)的視頻監(jiān)控,其背后的要求和邏輯是有很多共性的。但是長(zhǎng)期以來(lái)市場(chǎng)上并沒(méi)有這種“數(shù)據(jù)+應(yīng)用”的解決方案,所以即便有云服務(wù),應(yīng)用的開(kāi)發(fā)團(tuán)隊(duì)還是需要花費(fèi)大量的精力來(lái)做鑒權(quán)、轉(zhuǎn)碼、分發(fā)、直播等業(yè)務(wù)。
造成這種現(xiàn)象的重要原因是云服務(wù)時(shí)代的脫節(jié):網(wǎng)絡(luò)上現(xiàn)成的類(lèi)庫(kù)往往側(cè)重于功能,在單機(jī)來(lái)做相當(dāng)簡(jiǎn)單,但是云環(huán)境下的玩法不同于單機(jī),所以把單純的功能變成云服務(wù)環(huán)境下的應(yīng)用就成了相當(dāng)有挑戰(zhàn)的工作。結(jié)果,應(yīng)用開(kāi)發(fā)商自己來(lái)包裝卻事倍功半,或者云服務(wù)提供商提供了一些功能,但往往失之簡(jiǎn)單,無(wú)法與應(yīng)用深度結(jié)合。結(jié)果就是功能和云服務(wù)融合不起來(lái),總有功虧一簣的遺憾。
如果云服務(wù)提供商能深入理解各種應(yīng)用,把通用服務(wù)抽象出來(lái)并以云服務(wù)組件的方式提供,就能實(shí)現(xiàn)云服務(wù)提供商和應(yīng)用開(kāi)發(fā)商的雙贏。如果要給云服務(wù)打分的話,數(shù)據(jù)的存儲(chǔ)和簡(jiǎn)單處理就像是1,各種包裝好的應(yīng)用組件就像是0,有多少種應(yīng)用組件,1后面就有多少個(gè)0,效能就可以增加多少個(gè)數(shù)量級(jí)。從道哥給出的例子來(lái)看,七牛顯然已經(jīng)找到了不小的想象空間。
老許和道哥關(guān)于數(shù)據(jù)的“動(dòng)靜結(jié)合”的講解,我不由得想起以前看過(guò)的一本書(shū),《硬球:政治是這樣玩的》,因?yàn)楸敬未髸?huì)的介紹的方案,分享的經(jīng)驗(yàn),都在宣示“數(shù)據(jù)是這樣玩的”,讓大家看到數(shù)據(jù)的真正玩法,刷新大家對(duì)數(shù)據(jù)的認(rèn)識(shí)。
不過(guò)我也需要承認(rèn),聽(tīng)完整場(chǎng)大會(huì),長(zhǎng)期以來(lái)我的疑惑還是沒(méi)有得到解答。
如何確?!按髷?shù)據(jù)”真正反映了現(xiàn)實(shí),讓我們能基于此認(rèn)識(shí)世界呢?
我們當(dāng)然可以收集海量的、非結(jié)構(gòu)化的數(shù)據(jù),但現(xiàn)實(shí)世界高度復(fù)雜的,在應(yīng)對(duì)大數(shù)據(jù)時(shí),我們?nèi)绾尾拍茏C明在我們構(gòu)建的“數(shù)據(jù)世界”里已經(jīng)包括了足夠的數(shù)據(jù)?比如要分析人的某人運(yùn)動(dòng)模式,我們當(dāng)然需要收集人的運(yùn)動(dòng)軌跡,除了常見(jiàn)的經(jīng)緯度和速度,是否還需要關(guān)心高度、溫度、濕度、心跳等等信息?如果某項(xiàng)信息,比如血壓,與我們關(guān)心的內(nèi)容或規(guī)律密切相關(guān)而又沒(méi)有被收集進(jìn)來(lái),即便有了海量數(shù)據(jù),有了超強(qiáng)的數(shù)據(jù)分析能力,我們是否仍然會(huì)茫然無(wú)緒?退一步說(shuō),如果這些數(shù)據(jù)已經(jīng)收集了,但結(jié)構(gòu)不同,分布不同,歸屬不同,我們應(yīng)該如何把這些數(shù)據(jù)串通融合起來(lái),真正發(fā)現(xiàn)其中的規(guī)律?
這些問(wèn)題我沒(méi)有答案,我也認(rèn)為暫時(shí)不可能有答案。因?yàn)榻獯疬@類(lèi)問(wèn)題,不再依賴(lài)單純的思辨和邏輯的推理,而是更多需要依靠扎扎實(shí)實(shí)的探索,尤其需要大量有聰明才智和深厚積累的人才的持續(xù)投入。我能夠確認(rèn)的是,在這次的數(shù)據(jù)大會(huì)上,我看到了未來(lái)的希望。(作者:余晟)