在目前的南方大規(guī)模降雨中,百度、阿里巴巴等多家公司利用大數(shù)據(jù),即時發(fā)布武漢等城市街道積雨狀況的地圖,提醒出行市民提前避讓。這顯示了大數(shù)據(jù)的巨大威力和前景。
在日前舉辦的中國大數(shù)據(jù)產(chǎn)業(yè)峰會暨中國電子商務(wù)創(chuàng)新發(fā)展峰會上,中國工程院院士、中國互聯(lián)網(wǎng)協(xié)會理事長鄔賀銓向記者表示,大數(shù)據(jù)不能追求以大蓋全,而應(yīng)當追求數(shù)據(jù)精準并強調(diào)規(guī)律。“對一個大數(shù)據(jù)集而言,我們很難要求所有數(shù)據(jù)都精準,但只要大多數(shù)數(shù)據(jù)有代表性,就不妨礙我們利用數(shù)據(jù)集合得到較為準確的結(jié)果。”
據(jù)介紹, 2015年、2016年兩年內(nèi),全世界新產(chǎn)生的數(shù)據(jù)量約等于人類有史以來到2014年全球累積數(shù)據(jù)量的總和。鄔賀銓認為,大數(shù)據(jù)具有增長性、顆粒性、異構(gòu)性、移動性、多維性、隱私性等特點。他以醫(yī)療大數(shù)據(jù)為例介紹說,一個千萬人口的國內(nèi)城市50年累計的醫(yī)療數(shù)據(jù)量,預(yù)計能達到10PB級。這些數(shù)據(jù)具有多樣性和碎片化的特點,顆粒性大小差別很大。未來,人們需要將這些非結(jié)構(gòu)化數(shù)據(jù)轉(zhuǎn)換為結(jié)構(gòu)化數(shù)據(jù)進行處理和儲存。
“我們正加速進入大數(shù)據(jù)時代,但并不是所有數(shù)據(jù)都能開放,而是按照分類來進行部分開放?!编w賀銓說,大數(shù)據(jù)有很多來源,包括社會空間數(shù)據(jù)、物理空間數(shù)據(jù)和信息空間數(shù)據(jù)。比如國家安全數(shù)據(jù)、商業(yè)秘密數(shù)據(jù)、個人隱私數(shù)據(jù)這三方面的數(shù)據(jù)就不能開放。