涂子沛在接受共識網(wǎng)專訪

  嘉賓簡介:涂子沛,信息技術(shù)從業(yè)者,多家報(bào)刊網(wǎng)站專欄作家,華南理工大學(xué)公共政策研究院副教授。曾在國內(nèi)的公共部門和信息領(lǐng)域工作十年,后辭去公職赴美讀書,獲卡內(nèi)基梅隆大學(xué)信息技術(shù)科學(xué)碩士、公共管理碩士學(xué)位。新著有《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》一書,已由廣西師范大學(xué)出版社出版。

  訪談時(shí)間:2012年7月2日下午

  訪談地點(diǎn):廣西師范大學(xué)出版社(北京貝貝特出版顧問有限公司)

  一、大數(shù)據(jù):正在到來的數(shù)據(jù)革命

  楊傳銀:您寫《大數(shù)據(jù):正在到來的數(shù)據(jù)革命》這本書的初衷在哪里?您說這不是一本純粹談技術(shù)的書,而是以技術(shù)為背景探討人和社會(huì)的關(guān)系的書,這個(gè)觀察和寫作的角度是從什么時(shí)候開始建立的?

  涂子沛:這本書應(yīng)該說是時(shí)代浪潮的一個(gè)產(chǎn)物。我是理工科出身,大學(xué)畢業(yè)后我的第一份工作就是數(shù)據(jù)庫程序員。十幾年之后,我在美國的第一份工作是數(shù)據(jù)倉庫程序員,從數(shù)據(jù)庫變成了數(shù)據(jù)倉庫,這也是我們從小數(shù)據(jù)時(shí)代進(jìn)入大數(shù)據(jù)時(shí)代的明證。但更巧的是,十幾年前,我在中國為政府部門開發(fā)數(shù)據(jù)管理的軟件,現(xiàn)在在美國的工作,恰恰又是為美國的政府部門提供數(shù)據(jù)管理、分析的解決方案。這是一種“輪回”、也是一種“上升”,這種經(jīng)歷讓我找到了一個(gè)很好的角度來觀察、體驗(yàn)、分析兩個(gè)不同國家如何解決、處理一個(gè)相同的問題。無疑,中國在數(shù)據(jù)收集、使用和管理的各個(gè)方面,和美國相比都存在差距。但我發(fā)現(xiàn),最大的差距還是意識和態(tài)度。我們的傳統(tǒng)文化,長期重定性、輕定量;重觀點(diǎn)、輕數(shù)據(jù)。在現(xiàn)實(shí)生活中,數(shù)據(jù)也往往成為一個(gè)任人打扮的小姑娘,得不到應(yīng)有的尊重,數(shù)據(jù)的公信力嚴(yán)重不足。但正在到來的大數(shù)據(jù)時(shí)代,數(shù)據(jù)的作用將前所未有的凸顯,數(shù)據(jù)將成為國家競爭的前沿、企業(yè)創(chuàng)新的來源。這些傳統(tǒng)和現(xiàn)實(shí)的不足,是我們中國社會(huì)邁進(jìn)大數(shù)據(jù)時(shí)代的制約和障礙,我們應(yīng)該如何應(yīng)對?對這個(gè)問題的思考,催生了這本書。

  這本書首先是一本信息時(shí)代的科普讀本。但我想寫的,不僅僅是一本科普書。1997年,我在廣東省邊防局開發(fā)“反偷渡信息管理系統(tǒng)”的軟件,那時(shí)候我就明白了,要編好一個(gè)程序,就必須是商務(wù)過程的專家。其實(shí),技術(shù)工作永遠(yuǎn)是從業(yè)務(wù)中來、到業(yè)務(wù)中去的,技術(shù)歸根到底是為人和社會(huì)服務(wù)的。這個(gè)時(shí)代,我們好比身處一列快速奔馳的列車,技術(shù)就是它的發(fā)動(dòng)機(jī),我覺得幸運(yùn)的是,作為信息技術(shù)的從業(yè)者,我在這臺發(fā)動(dòng)機(jī)的核心部件上工作過,程序員把自己對業(yè)務(wù)的理解、自己的理念轉(zhuǎn)化為軟件,來改造世界。但這不夠,因?yàn)榘l(fā)動(dòng)機(jī)再強(qiáng)大、程序員再能干也不夠,火車要開到哪里去,是政治家、企業(yè)家在掌舵把航的。

  基于這些體會(huì),我努力嘗試在這本書中融合技術(shù)、政治、商業(yè)三個(gè)方面的視角。而且,這本書談的是“數(shù)據(jù)革命”,我想任何一種革命,首先都是社會(huì)層面的事。

  二、大數(shù)據(jù)時(shí)代會(huì)使不理性的人更不理性

  楊傳銀:大數(shù)據(jù)時(shí)代有沒有可能使不理性的人更不理性呢?

  涂子沛:有可能。這是我下一本書計(jì)劃要討論的內(nèi)容。下一本書,我想探討大數(shù)據(jù)時(shí)代潛在的弊端。這個(gè)時(shí)代,是個(gè)數(shù)據(jù)奔流的時(shí)代,信息無處不在。一個(gè)信息開放社會(huì)給不理性的人帶來的問題是,可能導(dǎo)致他“信息過度窄化”,例如,信息開放的時(shí)候,一個(gè)偏激的人更容易找到同類,然后放大異常,會(huì)變得更加偏激,而在一個(gè)信息流動(dòng)沒那么快、相對封閉的時(shí)代,偏激的人像是一個(gè)“孤島”,他更有可能會(huì)懷疑自己。仔細(xì)觀察信息時(shí)代中的人的境況,你會(huì)發(fā)現(xiàn)知識水平越高的人往往越頑固,這是因?yàn)樗涝趺慈カ@得支持自己的信息、形成自己的氣場。

  三、數(shù)據(jù)開放的界限

  楊傳銀:在數(shù)據(jù)開放的過程中,政府、公司和個(gè)人可能是不一樣的,這個(gè)數(shù)據(jù)開放的界限在哪里?

  涂子沛:目前,數(shù)據(jù)開放已經(jīng)形成了一股潮流。在各個(gè)國家數(shù)據(jù)開放的實(shí)踐中,基本形成了兩個(gè)界限,第一就是不危及國家安全,第二是不能侵犯公民隱私。當(dāng)然,對商業(yè)組織來說,還要顧及它的商業(yè)利益。

  在這幾個(gè)界限之外的數(shù)據(jù),都應(yīng)該開放,而且是免費(fèi)開放,其中的道理也很簡單,政府收集了數(shù)據(jù),用的是納稅人的錢、收集的也是關(guān)于納稅人的數(shù)據(jù),自然要向納稅人開放。你不能用我的鉗子、撥了我的毛,再賣給我收錢,對不對?英國社會(huì)這方面的步子邁得比美國還大,一個(gè)新的名詞:公民數(shù)據(jù)權(quán),也應(yīng)運(yùn)而生了。這是公共領(lǐng)域,商業(yè)領(lǐng)域,數(shù)據(jù)開放也是一個(gè)大的趨勢,我們也能看到各種各樣的商業(yè)數(shù)據(jù)正在走向開放。

  對個(gè)人來說,關(guān)鍵在于要有能力、渠道、權(quán)利去管理和自己身份相關(guān)的信息,你可以決定什么時(shí)候公開,以及用什么方式公開和自己相關(guān)的數(shù)據(jù)和信息。換言之,你個(gè)人對自己的數(shù)據(jù)必須要有控制權(quán)。因?yàn)檫@關(guān)系到你的隱私權(quán)。

 

  四、中國人有不尊重?cái)?shù)據(jù)的傳統(tǒng)

  楊傳銀:現(xiàn)在國內(nèi)對數(shù)據(jù)的重視您關(guān)注得多嗎?據(jù)說國內(nèi)可能是對內(nèi)做統(tǒng)計(jì),但是對外創(chuàng)造數(shù)據(jù)。

  涂子沛:我很關(guān)注,但總的情況是,不盡人意。我在書中詳細(xì)闡述了,中國人缺乏尊重?cái)?shù)據(jù)的傳統(tǒng)。我們現(xiàn)在好一些,認(rèn)識到了數(shù)據(jù)的重要性,但還是有很多問題,集中表現(xiàn)在,數(shù)據(jù)普遍缺乏公信力。發(fā)布數(shù)據(jù),是一件很嚴(yán)肅的工作,我在書中曾經(jīng)提到,2000年美國國會(huì)甚至專門通過了《數(shù)據(jù)質(zhì)量法》來確保政府發(fā)布數(shù)據(jù)的質(zhì)量。這個(gè)法律規(guī)定,政府發(fā)布的數(shù)據(jù),其產(chǎn)生方法必須是透明的,也就是說,要說清楚,數(shù)據(jù)怎么來的,每一個(gè)數(shù)據(jù),都有要有“出生證”,說明其產(chǎn)生的方法,這樣做了,這個(gè)數(shù)據(jù)就是可以“復(fù)制”的,這意味著,個(gè)人可以通過同樣的方法,獲得和政府同樣的數(shù)據(jù)和結(jié)論。美國的這些經(jīng)驗(yàn),我認(rèn)為,是值得我們借鑒的。

  此外,我們還要回到剛剛談到的開放數(shù)據(jù),一個(gè)數(shù)據(jù)是孤立的、難分對錯(cuò),一片數(shù)據(jù)才可以互相支持、互證真相,所以,要提高數(shù)據(jù)的公信力,最好的辦法就是開放數(shù)據(jù)、讓老百姓獲得一個(gè)數(shù)據(jù)背后的一片數(shù)據(jù)。

  我們社會(huì)常見的利用數(shù)據(jù)弄虛作假的問題,可以總結(jié)為幾個(gè)方面:一是一葉障目,片面解釋一個(gè)數(shù)據(jù),這其中也可能是別有用心、故意為之;二是人為的控制數(shù)據(jù)的收集和統(tǒng)計(jì)過程,使結(jié)果產(chǎn)生扭曲和偏差;三是暗箱操作、修改數(shù)據(jù);最后就是無中生有、“創(chuàng)造”數(shù)據(jù)了,這是最糟糕的,因?yàn)榧贁?shù)據(jù)比沒數(shù)據(jù)對社會(huì)的危害還要大。

責(zé)任編輯:admin