大數(shù)據(jù)來(lái)了。8月14日下午,甫一走進(jìn)北京國(guó)家會(huì)議中心二層會(huì)議室大門,“大數(shù)據(jù)”“云計(jì)算”“網(wǎng)絡(luò)營(yíng)銷”等鮮活名詞便闖入耳朵。
這里正在舉辦“2013中國(guó)大數(shù)據(jù)發(fā)展論壇”。雖然這是大數(shù)據(jù)第一次亮相頗具影響力的中國(guó)互聯(lián)網(wǎng)大會(huì),卻與2000年初談互聯(lián)網(wǎng)的場(chǎng)景相仿,容納數(shù)百人的會(huì)場(chǎng)座無(wú)虛席,臺(tái)上的演講者熱情高漲,臺(tái)下的聽眾豪情萬(wàn)丈。
幾乎所有人都意識(shí)到,大數(shù)據(jù)正在改變著人們的生活,它將帶來(lái)一場(chǎng)徹頭徹尾的革命,包括技術(shù)、產(chǎn)品、行業(yè)乃至整個(gè)經(jīng)濟(jì)運(yùn)作模式。
政府部門頒布的一紙政策恰到好處地鼓勵(lì)了人們發(fā)展大數(shù)據(jù)的決心。同一天,國(guó)務(wù)院發(fā)布《關(guān)于促進(jìn)信息消費(fèi)擴(kuò)大內(nèi)需的若干意見》,明確提出到2015年,信息消費(fèi)規(guī)模超過(guò)3.2萬(wàn)億元,年均增長(zhǎng)20%以上,帶動(dòng)相關(guān)行業(yè)新增產(chǎn)出超過(guò)1.2萬(wàn)億元,其中基于互聯(lián)網(wǎng)的新型信息消費(fèi)規(guī)模達(dá)到2.4萬(wàn)億元,年均增長(zhǎng)30%以上。
面對(duì)如此誘人而巨大的蛋糕,無(wú)論是傳統(tǒng)的IT企業(yè),還是在各種數(shù)據(jù)里摸爬滾打多年的互聯(lián)網(wǎng)公司,甚至電信運(yùn)營(yíng)商都禁不住怦然心動(dòng):IT企業(yè)譬如Oracle、IBM坐擁先進(jìn)的技術(shù),互聯(lián)網(wǎng)公司譬如百度、阿里巴巴則在廣告推送、個(gè)性化營(yíng)銷等方面率先踐行大數(shù)據(jù)技術(shù)多年,三大運(yùn)營(yíng)商亦掌握著其他企業(yè)無(wú)可媲美的真實(shí)且龐大的數(shù)據(jù)源,各方憑借自身優(yōu)勢(shì)競(jìng)相涉足大數(shù)據(jù),都打定了分一杯羹的主意。
實(shí)際上,大數(shù)據(jù)的發(fā)展態(tài)勢(shì)早就引起了工信部智囊團(tuán)隊(duì)——電信經(jīng)濟(jì)專家委員會(huì)的注意。財(cái)新記者獲悉,在2012年底的一次內(nèi)部交流中,幾十名來(lái)自學(xué)界、業(yè)界、政府部門的專家集中討論的話題只有一個(gè)——大數(shù)據(jù)。
在討論聲中,大數(shù)據(jù)從理論探討到實(shí)踐創(chuàng)新日漸紅火,我們有必要關(guān)注這一新興領(lǐng)域從何而來(lái),到底發(fā)展到了何種地步,又該如何拓寬大數(shù)據(jù)的盤子?為此,財(cái)新記者專訪了工業(yè)和信息化部電信研究院互聯(lián)網(wǎng)中心主任何寶宏博士,在他看來(lái),在技術(shù)的推動(dòng)下,以前不起眼的數(shù)據(jù)突然就變成了一種資源,而且還是一筆可能創(chuàng)造出巨大價(jià)值的資產(chǎn)。只是這筆資產(chǎn)的應(yīng)用目前還處于初級(jí)階段,也沒(méi)有相應(yīng)的政策針對(duì)性地去引導(dǎo)這些應(yīng)用。
大數(shù)據(jù)一定會(huì)成功
財(cái)新記者:現(xiàn)在市場(chǎng)都在熱議著大數(shù)據(jù),大數(shù)據(jù)的定義到底是什么?
何寶宏:坦白說(shuō),對(duì)于大數(shù)據(jù),業(yè)內(nèi)并沒(méi)有明確的概念。在維基百科或其他網(wǎng)絡(luò)解釋中,將“傳統(tǒng)工具無(wú)法處理的數(shù)據(jù)”稱為大數(shù)據(jù),有的會(huì)加一些定語(yǔ),譬如“在有效的時(shí)間里”。
在我看來(lái),大數(shù)據(jù)的重點(diǎn)在于如何處理“大”?!按蟆币馕吨萘看?、內(nèi)存多、變化快,相對(duì)來(lái)說(shuō),也是指處理這種數(shù)據(jù)的能力或工具,既然是大數(shù)據(jù),就意味著是分析、處理、應(yīng)用不規(guī)則且一直在變化的數(shù)據(jù)。
財(cái)新記者:目前,大數(shù)據(jù)發(fā)展到了何種程度?
何寶宏:大數(shù)據(jù)現(xiàn)在還不是一個(gè)行業(yè),它是嵌入在云計(jì)算里發(fā)展的,規(guī)模還很小。它的發(fā)展尚處于初級(jí)階段,還沒(méi)有成長(zhǎng)到能夠從云計(jì)算里獨(dú)立出來(lái)。要從云計(jì)算里獨(dú)立出來(lái),至少還需要三五年的時(shí)間。
相對(duì)來(lái)說(shuō),云計(jì)算已經(jīng)過(guò)了概念描述期,正處于一個(gè)高速成長(zhǎng)的階段,而現(xiàn)在的大數(shù)據(jù),就像三五年前的云計(jì)算,還處于培育期,大家都在討論到底該怎么做產(chǎn)品、怎么樣才會(huì)有市場(chǎng)。簡(jiǎn)言之,大數(shù)據(jù)處于吹泡沫階段,云計(jì)算已經(jīng)吹完泡沫,務(wù)實(shí)發(fā)展了。不過(guò),雖然大數(shù)據(jù)是剛剛才開始的技術(shù),可這個(gè)技術(shù)迎合了社會(huì)的需求,一定會(huì)成功。
財(cái)新記者:大數(shù)據(jù)與物聯(lián)網(wǎng)、云計(jì)算的關(guān)系是怎樣的?
何寶宏:物聯(lián)網(wǎng)可以看成是大數(shù)據(jù)的采集環(huán)節(jié),云計(jì)算為大數(shù)據(jù)提供一個(gè)通用的處理平臺(tái),但僅僅依靠云計(jì)算這個(gè)平臺(tái)是不夠的,需要在云計(jì)算這個(gè)平臺(tái)上專門針對(duì)大數(shù)據(jù)處理做一些工作。
物聯(lián)網(wǎng)與大數(shù)據(jù)的關(guān)系要遠(yuǎn)一層,至于云計(jì)算與大數(shù)據(jù),就像操作系統(tǒng)與數(shù)據(jù)庫(kù)管理系統(tǒng)一樣。大數(shù)據(jù)是基于云計(jì)算的基礎(chǔ)服務(wù),幾乎每一個(gè)大數(shù)據(jù)的處理都要依托云計(jì)算平臺(tái)。
誰(shuí)是大玩家
財(cái)新記者:大數(shù)據(jù)這一概念為何會(huì)在現(xiàn)在爆發(fā)?
何寶宏:任何技術(shù)都不是平白無(wú)故出來(lái)的。2000年以前,大家都致力于研究傳統(tǒng)的數(shù)據(jù)庫(kù),對(duì)結(jié)構(gòu)化數(shù)據(jù)進(jìn)行處理;2000年以后,以谷歌、亞馬遜這幾家互聯(lián)網(wǎng)巨頭為代表,開始對(duì)非結(jié)構(gòu)化的數(shù)據(jù)進(jìn)行處理,并運(yùn)用數(shù)據(jù)挖掘的成果去推薦自身產(chǎn)品或投放廣告等。
直到2011年、2012年,經(jīng)過(guò)了十年的實(shí)踐、研究,互聯(lián)網(wǎng)巨頭們終于通過(guò)不斷的技術(shù)創(chuàng)新,找到了一種廉價(jià)的、高效的處理各類不規(guī)則數(shù)據(jù)的方法,并從這種數(shù)據(jù)處理、應(yīng)用中獲益不菲。在有利可圖的情況下,況且這筆利潤(rùn)可能還不小,其他行業(yè)自然意欲將互聯(lián)網(wǎng)企業(yè)的做法搬到自己所處的行業(yè)中,這樣,大數(shù)據(jù)這一概念就被包裝出來(lái)了,也就是近兩年的事情。
財(cái)新記者:當(dāng)前,依托大數(shù)據(jù),可否有成功的盈利模式?
何寶宏:現(xiàn)在,大數(shù)據(jù)應(yīng)用得最成功的還是一些互聯(lián)網(wǎng)企業(yè)。百度可以通過(guò)分析用戶語(yǔ)義,了解用戶習(xí)慣、愛好,以便推送廣告,阿里巴巴也能利用數(shù)據(jù)挖掘進(jìn)行精準(zhǔn)的產(chǎn)品營(yíng)銷,這種根據(jù)用戶瀏覽、搜索等行為分析用戶需求繼而推送廣告或產(chǎn)品,是當(dāng)前最典型的大數(shù)據(jù)應(yīng)用模式。
實(shí)際上,等大數(shù)據(jù)真正發(fā)展起來(lái),可能會(huì)出現(xiàn)超乎想象的應(yīng)用,就像谷歌通過(guò)分析人們搜索的關(guān)鍵詞竟然可以對(duì)流行病進(jìn)行預(yù)測(cè)那樣,很多創(chuàng)新性的應(yīng)用將隨之出現(xiàn),發(fā)展空間之大我們目前還難以預(yù)料。
財(cái)新記者:大數(shù)據(jù)現(xiàn)在最主要的應(yīng)用在互聯(lián)網(wǎng)領(lǐng)域,具體案例如何?可否供其他行業(yè)借鑒?
何寶宏:以淘寶為例,這個(gè)電子商務(wù)平臺(tái)擁有的商品超過(guò)10億種,交易總額已經(jīng)突破萬(wàn)億,每天約有30億次網(wǎng)頁(yè)瀏覽、數(shù)千萬(wàn)筆商品交易。如此多的商品數(shù)據(jù)、用戶數(shù)據(jù)、交易數(shù)據(jù)、社交數(shù)據(jù)等,經(jīng)過(guò)分析、挖掘,最終形成的應(yīng)用流向了交易的全過(guò)程,包括用戶潛在的購(gòu)買需求預(yù)測(cè)、針對(duì)性地推送產(chǎn)品、商品滿意度調(diào)查、商家信譽(yù)等,甚至還流向了支付、保險(xiǎn)、物流等環(huán)節(jié),衍生出極具想象力的應(yīng)用。