當數字數據洪流席卷世界之后,每個地球人都可以獲得大量數據信息,相當于當時亞歷山大圖書館存儲的數據總量的320倍之多。中國不同省份、不同部門,甚至同一省份不同委、辦、局之間數據集類型差異較大,數據集格式不統一。有的數據在地市級集中,有的在省級集中,無論數據格式、數據結構、采集指標都存在差異。只有數據集類型和格式統一,才有利于數據的收集、整合、分析和處理的自動化。[page]
作為公共數據資源,除了涉密數據,應做到對內共享,對外公開。一方面,政府內部共享存在障礙。很多部門將數據視為部門資產,拒絕與其他部門共享。另一方面,數據公開處于起步階段。以某省提供的交通數據為例,在該省的開放數據門戶上開設了交通數據專欄,但僅公布了省內公交車站的地理位置。如此少的信息量對于開發(fā)者們來說如同雞肋,但假如政府能開放更加詳細的信息,如公交時刻表、公交承載能力、滿座率、票價等,開發(fā)者將能夠給這些開放數據創(chuàng)造大量附加值。由于大數據具備體量巨大、價值稀疏、時效性強等特點,對現有企業(yè)信息架構、系統的沖擊是不言而喻的。企業(yè)可以采用大數據技術來獲得對消費者的深刻理解,對其行為形成預判,重獲主動權。在不遠的未來,大數據技術將引發(fā)金融、政府、公共事業(yè)、制造業(yè)、流通等領域全面的變革。
在數據儲備—數據挖掘—數據定點應用—數據訂制互動—休眠數據儲備等產業(yè)鏈的各個環(huán)節(jié),市場均存在巨大的市場需求。來自IDC的數據顯示,2010年全球大數據以及相關的硬件、軟件和服務市場已達到32億美元,2015年整個市場將超過170億美元。我們預計2015年以后中國大數據行業(yè)將達到20億美元左右,其中財經大數據將達到10億美元左右。而目前中國的財經大數據行業(yè)處于發(fā)展的起步階段,大部分應用領域甚至仍然處于有需求但沒有供給的空白階段,或被不太了解中國經濟的國際咨詢機構所占據。
數據挖掘分析輸出的目標客戶則是各類金融機構、進出口貿易單位、礦業(yè)單位等。通過國家金融大數據分析可預判市場走勢或市場需求的各類關聯企業(yè)單位。金融投資、跨國企業(yè)、保險基金類企業(yè)公共風險控制類企業(yè),這些單位是需要時刻了解國家行業(yè)指數和金融實時數據變化的。這類企業(yè)應該是大數據應用的核心群體,需要通過機頂盒年費制來進行加密提供訂制服務。數據挖掘分析輸出還有其他行業(yè)的目標客戶,主要是國防科工領域。在這個領域里,國家已經逐步開放國防采購,而供應商普遍是原來的軍工企業(yè)單位。這類企業(yè)在非戰(zhàn)爭時期,大多是靠軍品轉民品來維持企業(yè)的,所以,對普遍制造業(yè)相關的原材料成本情況、銀行貸款及進出口政策、稅率以及社會其他成本支出等與制造業(yè)相關的數據都需要時刻了解。
技術水平落后,數據獲取成本太高。首先是經濟成本較高。根據國家行政學院課題組的調查,目前中央政府層面有上百類數據需付費,各部委根據實際情況采用的收費模式各不相同。開發(fā)者是否能為開放數據創(chuàng)造出附加值,開發(fā)的應用是否符合商業(yè)預期等都存在許多不確定性。因此,對數據收費將阻礙數據的創(chuàng)新發(fā)展。與歐美發(fā)達國家相比,中國信息化差距仍然較大,特別在寬帶建設和新技術應用創(chuàng)新方面明顯落后。根據國際電信聯盟發(fā)布的“信息通訊技術發(fā)展指數(IDI)”,中國2008年的信息化水平在國際排名中位于第79位,相比2007年下降了6位。2008年以后下降的趨勢還在持續(xù)。在聯合國經濟與社會事務部發(fā)布的“電子政務發(fā)展指數(EGDI)”排名中,2005年,中國處于第57名,到2008年下降到65名,2012年再下降到78名。存儲的數據僅為日本的60%和北美的7%,而且中國所存儲的數據應保護的有一半未保護。2013年年底,全球移動數據流量月均為529兆,是中國的3~4倍。預計到2018年,用戶使用的信息終端將會全面移動化,每個用戶平均擁有1.4臺接入網絡的移動設備,38%的用戶將會攜帶個人移動設備辦公,這將催生海量的移動應用和數據。在2014年中國互聯網安全大會上,中國互聯網協會理事長鄔賀銓認為:“將來移動智能終端的數量將超過地球人口的總和,其在保持動態(tài)運作時也將產生無法預知的漏洞?!?/div>
亟須盡快建設信息資源開放平臺。我們要根據中國實際情況,利用美國開源標準,借鑒美國data.gov和apps.gov運營方式,盡快建設信息資源開發(fā)平臺。在大數據技術研發(fā)方面,國內企業(yè)與谷歌、IBM、亞馬遜等國際巨擘存在一定的差距,尤其是缺乏高端的數據科學家,不能有效利用現有的數據資源。同時,互聯網已經滲透軍事、文化、政治、經濟等各個領域。聯合國裁軍機構報告稱,世界上有46個國家建立了網絡作戰(zhàn)部隊,100多個國家在發(fā)展網絡戰(zhàn)裝備。中國網絡安全立法還存在很明顯的不足,從總體上看比較分散,立法層次較低,尚未構成信息安全法律體系。此外,中國不具備掌握互聯網資源的一些技術條件?,F在所使用的通用芯片,都依賴于美國;95%的操作系統來自微軟;從移動領域來看,三大操作系統平臺都來自美國,比如,全球互聯網管理架構由美國控制;平時大家上網,都需要通過根服務器引導,而全球13臺根服務器中,有11臺在美國。
基于大數據的國家治理現代化的政策措施
萬物互聯將是未來的趨勢,未來的世界大國必然是信息制造強國,大數據不僅是企業(yè)發(fā)展的引擎,更是國家創(chuàng)新能力和整體競爭力的關鍵因素。隨著其重要性不斷提升,甚至能夠超越領土、領海、領空主權,成為更為重要的數字主權。政府需要認識到大數據的重要性,制定相關政策,充分挖掘大數據的價值。中國政府治理創(chuàng)新的關注點聚焦于政府核心業(yè)務和國計民生重大事件;著力點集中于加強全網外部數據和政府業(yè)務數據融合分析;落腳點放在改進政府自身工作、提高政府回應能力。盡快構建中國信息資源開放平臺,促進信息共享與業(yè)務協同,努力為人民群眾提供更方便快捷、更優(yōu)質高效的公共服務,以滿足各級政務部門在經濟調節(jié)、市場監(jiān)管、社會管理、公共服務等方面的需要。
營造大數據發(fā)展的人文和產業(yè)生態(tài)環(huán)境。政府在創(chuàng)造數據共享和交易的有效市場方面可以發(fā)揮重要作用,包括制定知識產權方面規(guī)則、制定鼓勵數據共享的獎勵措施、強制要求收集并公開國企財務數據,以及面向公眾開放、共享政府部門活動和項目信息等。政府應率先垂范,推動國家基礎數據開放共享。美國十分重視政府信息資源的共享和利用,將“共享第一”作為美國聯邦IT共享服務戰(zhàn)略的基礎范式,力推政府開放平臺(Open Government Platform)。中國應加快推進政府信息資源共享,尤其要推進數據資源共建共享,給大數據技術發(fā)展提供原材料,促進大數據成果廣泛應用。制定平衡數據使用與數據安全保護的政策,有效完善并嚴格執(zhí)行關于商業(yè)內部信息和個人數據隱私的維護方針,并通過強大的法律阻擋黑客和其他襲擊。同時,政府、非營利組織和私人部門需要相互配合開發(fā)大數據知識普及的公共教育宣傳項目,以便公眾理解哪些個人信息是可以獲取的,如何使用、怎樣使用,以及個人是否允許這種使用。大數據的應用離不開產業(yè)界的創(chuàng)新,應大力支持產業(yè)發(fā)展。一是加大研發(fā)支持力度。在明確關鍵技術的基礎上,確定重點支持領域,加大研發(fā)支持力度。整合核高基、電子發(fā)展基金、云計算專項、物聯網專項基金等項目,支持大數據技術的開發(fā)、研究和應用示范,引導企業(yè)加大研發(fā)力度,實現關鍵技術突破。二是加快推進應用。在政府部門和公用事業(yè)的信息化應用中采購大數據技術,以政府采購引導國內大數據發(fā)展。結合當前的云計算、物聯網等試點工程,積極開展大數據技術應用,充分發(fā)揮示范效應,帶動社會其他領域的大數據應用。根據國外應用經驗,可以確定一些重點應用領域,例如電子政務、醫(yī)療、教育、能源、交通等,以點帶面加速大數據技術的應用,并總結示范經驗予以推廣??傊髷祿夹g及互聯網思維帶給政府的不僅僅是效率提升、科學決策、精細管理,更重要的是數據治國、科學管理的意識改變,未來將更會從各個方面來幫助政府實施高效和精細化管理。政府運作效率的提升,決策的科學客觀,財政支出合理透明都將大大提升國家整體實力,成為國家競爭優(yōu)勢。
培育和擴大人才供給,完善政府間的協同治理機制。人才短缺是制約大數據發(fā)展的短板,政府應采取多種措施,擴大大數據相關人才供給。在大學有針對性地增加大數據相關課程,增加學生在數據倉庫、數據搜索、數據挖掘與可視化等領域的知識積累,擴大人才儲備規(guī)模,擴充科研力量。到2012年4月,世界上已有50家大學提供大數據研究生課程、碩士和博士學位。加大從其他國家地區(qū)引進人才的力度,實施各項優(yōu)惠政策、營造良好發(fā)展環(huán)境以吸引國外優(yōu)秀的大數據技術人員,增強中國相應研發(fā)實力。制定政策優(yōu)待、資金補貼、獎勵機制等一系列激勵措施,鼓勵企業(yè)對管理者普及數據分析技術培訓,幫助樹立大數據發(fā)展理念,明確大數據在指導生產決策、提升企業(yè)效益、拓展產業(yè)空間等方面的重要作用,推動企業(yè)使用相關技術,明確消費需求,創(chuàng)新產品及服務。
充分發(fā)揮政府主導作用,發(fā)揮產學研用領域專家及人才作用,建立專門的政府大數據應用推進機構。應由高層領導牽頭,成立相關部分負責人共同參與的領導小組,負責改革總體設計、統籌協調、整體推進、督促落實。應定期或不定期召開聯席會議。聯合政產學研用等方面的專家,成立專家委員會,對大數據應用的推進工作提供指導和理論支撐。加大數據集中力度。根據跨部門協同辦公的需要,以部門業(yè)務信息為基礎,從標準、流程、數據三個方面來設計,形成“物理分散、邏輯集中”的公共數據中心。通過制度保障和技術支持,對關鍵部門、重點業(yè)務、重要數據進行集中,統一處理,建立統一的政務信息資源目錄和政務信息資源庫,形成海量數據交換、共享、查詢和管理機制。進一步通過數據集中挖掘,提高數據利用率,提高各級政府行政管理效率和公共服務水平。
制定大數據及其相關產業(yè)的標準,建立健全相關法律體系。大數據支撐的信息技術革命,遵循著摩爾定律、吉爾德定律、梅特卡夫定律三大鐵律。所謂摩爾定律是指每18個月電腦性能翻兩番,預計2018年人工芯片、人工神經網絡將超過人腦,達300億個;所謂吉爾德定律是指主干網帶寬每6個月增長一倍;所謂梅特卡夫定律是指網絡價值等于節(jié)點數的平方。這三大定律會使得數據呈現冪指數級增長。
無人機、3D打印、眾籌、普惠、脫媒大數據的數據來源主要是個人數據和政府數據。個人數據方面,中國應借鑒國外的相關立法,并結合中國的實際,加快制定關于公民個人數據隱私保護的法律法規(guī),明確個人數據的保護范圍,真正讓公民做到有法可依。由于個人隱私涉及的內容比較廣泛,如果侵犯隱私的法律法規(guī)不夠具體,依然起不到明顯的效果,當公眾的隱私受到侵犯時,仍會陷入無法可依的怪圈。因此,相關的法律法規(guī)應首先明確隱私的內容,然后針對不同的內容分別立法。這點可借鑒美國的立法。例如,美國針對銀行內客戶個人賬戶資料泄漏問題,制定了《金融隱私法》;針對竊聽監(jiān)視電子信息,如通話內容被泄漏等問題,制定了《電子通訊隱私權法》;針對非法收集兒童資料的問題,制定了《兒童隱私保護法》,規(guī)定對12歲以下兒童資料的收集要征得家長的同意。政府數據方面,應妥善處理相關法律法規(guī)制定、修改、廢止之間的關系;強化電子政務、信息安全、政府信息公開等方面的法律法規(guī)體系建設。由于大數據具有可復制性,知識產權保護顯得尤其重要。在大數據時代,需要不斷進行技術、產品和服務創(chuàng)新,以促進數據共享和整合,推動數據價值的創(chuàng)造。這些創(chuàng)新需要建立有效的知識產權保護體系作為保障。加快制定相關標準和指南,鼓勵存在缺口的重要領域推進關鍵技術研發(fā),推動行業(yè)標準制定機構出臺覆蓋IT工具和數據類型的標準,并給予資金支持、稅收減免、費用補貼、金融支持等激勵措施。
注釋
1、24王忠:《美國推動大數據技術發(fā)展的戰(zhàn)略價值及啟示》,《中國發(fā)展觀察》,2012年第6期(總第90期),第44~45頁。
2、Taviani V., Hickson S.S., Hardy C.J., "Age‐related changes of regional pulse wave velocity in the descending aorta using Fourier velocity encoded M‐mode", Magnetic Resonance in Medicine, 2011, 65(1): pp. 261-268.
3、Chowdhury A. Global pulse, 2011.
4、Bizer C., Boncz P., Brodie M.L., "The meaningful use of big data: four perspectives--four challenges", ACM SIGMOD Record. 2012, 40(4): pp. 56-60.
5、趙彥云、芳周:《試論大數據時代中國政府統計改革發(fā)展新模式》,《教學與研究》,2014年第1期,第20~26頁。
6、吳文平、陳沁蓉:《以大數據為支點推動轉型》,《新聞戰(zhàn)線》,2014年第1期,第53~55頁。
7、王金照、于曉龍:《大數據的經濟學涵義及價值創(chuàng)造機制》,《中國國情國力》,2014年第2期,第28~30頁。
8、Kum Hye-Chung, Krishnamurthy Ashok, Machanavajjhala Ashwin,"Social Genome: Putting Big Data to Work for Population Informatics", Computer, 2014, 47(1): pp. 56-63.
9、17Xindong Wu, Xingquan Zhu, Gong-Qing Wu, "Data Mining with Big Data", IEEE Transactions on Knowledge and Data Engineering, 2014, 26(1): pp. 97-107.
10、21Morris Carol Minton, "Cloud Computing, Big Data, and Open Access at EDUCAUSE 2009", D-Lib Magazine, 2010, 16(1/2): pp. 12-12.
11、王姍:《個人數據經濟時代中國個人資料隱私權私法保護之完善》,《法制與經濟(下旬)》,2013年第9期,第70~72頁。
12、22、23維克托·舍恩伯格:《刪除:大數據取舍之道》,袁杰譯,杭州:浙江人民出版社,2013年。
13、Harrison T.M., Guerrero S., Burke G.B, "Open government and e-government: Democratic challenges from a public value perspective", 2011.
14、19涂子沛:《大數據:正在到來的數據革命,以及它如何改變政府、商業(yè)與我們的生活》,桂林:廣西師范大學出版社,2012年。
15、陳美:《大數據在公共交通中的應用》,《圖書與情報》,2012年第6期,第22~28頁。
16、伏創(chuàng)宇:《兩岸信息公開豁免案例之比較評析——以個人隱私和商業(yè)秘密之探討為中心》,《行政法論叢》,2010年第13卷,第344~376頁。
18Harrison T.M., Guerrero S., Burke G.B., "Open government and e-government: Democratic challenges from a public value perspective", 2011; Meijer A.J., Curtin D., Hillebrandt M., "Open government: connecting vision and voice", International Review of Administrative Sciences, 2012, 78(1): pp. 10-29.
20李國杰、程學旗:《大數據研究:未來科技及經濟社會發(fā)展的重大戰(zhàn)略領域——大數據的研究現狀與科學思考》,《中國科學院院刊》,2012年第6期,第647~657頁。
作者
陳立,國家行政學院黨委委員、副院長、研究員。研究方向為公共經濟與公共政策、政府經濟學。