一、“大數據”概述
(一)大數據的概念和特征
“大數據”(big data)是一個體量特別大、數據類別特別大的數據集,并且這樣的數據集無法用傳統(tǒng)數據庫工具對其內容進行抓取、管理和處理。總體而言,大數據是需要新處理模式才能具有更強的決策力、洞察發(fā)現(xiàn)力和流程優(yōu)化能力的海量、高增長率和多樣化的信息資產。從數據類別上看,大數據指的是無法使用傳統(tǒng)流程和工具進行處理或分析的信息,它定義了那些超出正常處理范圍和大小、迫使用戶采用非傳統(tǒng)處理方法的數據集。亞馬遜網絡服務(AWS)、大數據科學家John Rauser提到一個簡單的定義:大數據就是任何超過了一臺計算機處理能力的龐大數據量。大數據是可能不包含所有的信息,但包含了大部分的信息。對大數據的一部分認知在于,它是如此之大,分析它需要多個工作負載,這是AWS的定義。當技術達到極限時,也就是數據的極限。大數據的關鍵不是如何定義,而是如何使用,最大的挑戰(zhàn)在于哪些技術能更好的使用數據以及大數據的應用情況如何。
大數據的特征主要體現(xiàn)在四個方面:首先是指數據體量大,大型數據集一般在10TB規(guī)模左右,但在實際應用中,很多企業(yè)用戶把多個數據集放在一起,已經形成了PB級的數據量;其次是指數據類別大,數據來自多種數據源,數據種類和格式日漸豐富,已沖破了以前所限定的結構化數據范疇,囊括了半結構化和非結構化數據;三是數據處理速度快,在數據量非常龐大的情況下,也能夠做到數據的實時處理;四是數據真實性高,隨著社交數據、企業(yè)內容、交易與應用數據等新數據源的興趣,傳統(tǒng)數據源的局限被打破,企業(yè)愈發(fā)需要有效的信息之力以確保其真實性及安全性。
“大數據”的概念遠不止大量的數據(TB)和處理大量數據的技術,更讓我們以一種前所未有的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,或深刻的洞見,最終形成變革之力。從數據分析的角度,包含五個方面:一是可視化分析(Analytic Visualizations),大數據分析的使用者有大數據分析專家,同時還有普通用戶,但是他們二者對于大數據分析最基本的要求就是可視化分析,因為可視化分析能夠直觀的呈現(xiàn)大數據特點,同時能夠非常容易被讀者所接受,就如同看圖說話一樣簡單明了;二是數據挖掘算法(Data Mining Algorithms),這是大數據分析的理論核心,各種數據挖掘的算法基于不同的數據類型和格式才能更加科學的呈現(xiàn)出數據本身具備的特點,也正是因為這些被全世界統(tǒng)計學家所公認的各種統(tǒng)計方法才能深入數據內部,挖掘出公認的價值。另外一個方面也是因為有這些數據挖掘的算法才能更快速的處理大數據,如果一個算法得花上好幾年才能得出結論,那大數據的價值也就無從說起了。三是預測性分析能力(Predictive Analytic Capabilities),預測性分析是大數據分析最重要的應用領域之一,從大數據中挖掘出特點,通過科學的建立模型,之后便可以通過模型帶人新的數據,從而預測未來的數據。四是語義引擎(Semantic Engines),由于非結構化數據的多樣性帶來了數據分析的新挑戰(zhàn),需要一系列的工具能夠從“文檔”中解析、提取、分析數據。五是數據質量和數據管理(Data Quality and Master Data Management),大數據分析離不開數據質量和數據管理,高質量的數據和有效的數據管理,無論是在學術研究還是在商業(yè)應用領域,都能夠保證分析結果的真實和有價值。
(二)大數據的作用
政府部門越來越注重運用技術手段對數據資源進行深度的價值挖掘,滿足日益增長的精細化、科學化管理需要。與此同時,隨著社會經濟文化的發(fā)展和進步,公眾對政府和職能部門的要求也越來越高,集中表現(xiàn)為要求提高行政效率和透明度、創(chuàng)新工作方式、提高對社會的服務能力等。
首先,有利于為市民的日常生活提供服務。隨著生活水平的不斷提高,市民對包括氣象、食品安全、交通等在內的生活資訊類信息愈發(fā)關注,實現(xiàn)此類信息的公開,為市民提供更準確、及時、便利的日常生活服務,將促進政府服務轉型,樹立良好的政府形象。
其次,有利于提高政府部門提高行政管理水平。體現(xiàn)在兩個方面:一是有利于提升政府部門協(xié)同共享。隨著經濟社會的快速發(fā)展,資源環(huán)境的約束H益顯現(xiàn),城市的發(fā)展轉型迫在眉睫,對政府管理部門的管理能力提出了更高的要求,將倒逼政府部門問實現(xiàn)公共信息資源的共享。二是有利于提升管理決策水平。在政策制定階段,數據分析是決定政策質量高低的關鍵性因素。在政策實施階段,數據分析能夠有效監(jiān)控政策實施情況。通過數據分析監(jiān)控,可以掌握政策是否按計劃實施,對于計劃實施過程中出現(xiàn)的問題或失誤,數據分析工作可以及時、準確地反映。在政策評估階段,需要通過科學的數據分析來解答,對未來政策的完善提供借鑒。
第三,有利于為企業(yè)發(fā)展提供服務。政府信息公開,側重于政府信息的社會屬性。在創(chuàng)新驅動、轉型發(fā)展的背景下,政府部門公共信息資源的經濟屬性越來越受到企業(yè)的關注。當前,政府部門的公共信息資源已成為一種創(chuàng)造價值的新的生產要素,向企業(yè)開放后,將會極大地推動本市信息服務業(yè)的發(fā)展。
(三)政府“大數據”應用的需求分析
1、政府職能轉變迫切地需要大數據加以支撐
從內部管理的角度看,政府需要降低行政成本、提高決策的科學化水平。在信息化時代,政府機構、職能有效發(fā)揮依賴高效、實時的信息系統(tǒng)、尤其是大數據的支持。信息化時代,政府掌握著大量的、關鍵的數據,是數據時代的財富擁有者,但以往由于信息技術、體制機制等限制,各級政府及各部門之間的信息網絡往往自成體系,相互割裂,相互之間的數據難以實現(xiàn)互通和共享,導致目前政府掌握的數據大多處于割裂和休眠狀態(tài)。同時由于政府各部門信息系統(tǒng)分割,許多數據往往需要重復采集,數據采集成本較高。隨著大數據和云計算技術的發(fā)展,建設統(tǒng)一的政府信息系統(tǒng)平臺成為可能。通過統(tǒng)一的信息平臺,實現(xiàn)數據的標準、格式的統(tǒng)一和共享,利用大數據技術,數據獲取、處理及分析響應時間大幅減少,工作效率明顯提高,有利于壓縮政府開支,降低行政成本。同時,對于數據的統(tǒng)一和共享所產生的大數據,通過數據挖掘等技術,能夠增強政府社會管理水平。大數據在政府和公共服務領域的應用,可有效推動政務工作開展,提高政府部門決策的科學化水平、服務效率和社會管理水平。
從對外服務的角度看,政府提供公共服務、促進經濟社會發(fā)展的職能發(fā)揮同樣需要大數據支持。政府掌握了大量關于人口、法人和城市空間地理等數據,提供滿足群眾需求、針對性的公共服務需要對所掌握數據的精細分析。憑借大數據,城市公共衛(wèi)生、教育、城市規(guī)劃、交通服務能夠得到改善,基于大數據分析結論的政府公共服務決策能夠更好的滿足市民需求。目前,各個地方政府大力興建智慧城市,智慧城市已成為國內信息化建設的潮流,“智慧”的關鍵在于對大數據的研究,只有利用大數據分析,才能實現(xiàn)電子政務信息系統(tǒng)有效整合,實現(xiàn)跨部門的政府信息資源共享和政務協(xié)同,讓政府的管理服務效能提升,讓民眾感受到政府無處不在服務。政府另一項職能是促進經濟社會發(fā)展,如在經濟異常波動時實施宏觀調控,政府對大數據信息的掌握和分析,直接決定了宏觀調控的效果。這些都對大數據提出了要求。
2、統(tǒng)一共享的數據平臺是實現(xiàn)大數據發(fā)展的重要前提
對于大數據基礎庫,代表性的有人口、法人和空間地理三大基礎庫。這三大基礎庫收集了大量的居民、企業(yè)和城市空間地理信息,數據量龐大,這些數據的有效發(fā)揮需要大數據收集、存儲、管理、運用技術的支持。同時三大基礎數據庫與各專業(yè)庫的統(tǒng)一及共享,有利于降低政府信息使用成本,提高行政效率。同時也為專業(yè)庫和應用庫層次提供了信息系統(tǒng)基礎設施支撐。目前,政府掌握數據中大部分都是非結構化的數據,現(xiàn)有的軟件和工具主要適用于以結構化數據為主的傳統(tǒng)數據,要想及時捕捉、存儲、聚合和管理這些大數據,以及對數據進行深度分析和挖掘,政府首先需要全面整合并打通三大基礎數據庫與各專業(yè)庫的互連阻礙,建立統(tǒng)一的、共享的基礎數據平臺。
專業(yè)庫是基于基礎庫的專業(yè)數據庫,如教育庫、醫(yī)療庫、交通庫等,這些專業(yè)數據庫為方便居民生活提供了條件??梢灶A見,隨著經濟社會的發(fā)展,政府的公共服務職能將更加突出,主動服務群眾、提供公開透明的信息是時代對政府的要求?;诨A庫,政府各部門對教育、醫(yī)療、交通等專業(yè)庫信息進行深度共享、數據挖掘,有利于政府掌握更細致的信息,為居民提供更加個性化、更加貼心的公共服務。如個性化醫(yī)療:比如對病人的醫(yī)療數據、電子病歷、遺傳情況、職業(yè)特征、飲食狀況等運用大數據技術進行分析、挖掘,可以幫助大夫提供更個性化的醫(yī)療服務。
應用庫是基于基礎庫和專業(yè)庫的數據基礎,可為社會提供針對性的應用服務。政府職能之一就是促進經濟發(fā)展,尤其是在上海市“創(chuàng)新驅動、轉型發(fā)展”的大背景下,大數據、云計算等新興技術層出不窮,新應用、新商業(yè)模式不斷涌現(xiàn),要求政府向社會、企業(yè)開放大數據服務,并引導企業(yè)探索創(chuàng)新數據產業(yè)業(yè)務模式,積極培育大數據產業(yè)。隨著數據開放度的加大,基于開放數據開發(fā)的應用系統(tǒng)越來越多,這種大眾創(chuàng)新和社會創(chuàng)新模式將越來越普遍。開放大數據服務,不僅有利于本市形成完善的數據產業(yè)鏈,有利于培育戰(zhàn)略性新興產業(yè),并將有力促進本市經濟結構轉型。
(四)當前政府數據管理的主要特征
“政府數據管理”有兩個含義:一是對政府信息本身的管理,即對政府信息的收集、加工、存儲、傳遞、反饋和利用的過程管理;二是對涉及政府信息活動的各種信息資源要素管理,如公務人員、行政組織、政府信息及其開發(fā)利用支撐技術等結合起來進行管理,從而有效地滿足政府部門行政管理需求的全過程。政府數據管理的目的是政府數據資源得到充分開發(fā)和利用,以實現(xiàn)政府辦公業(yè)務數據資源共享與網上政府向社會公眾提供政府信息服務。政府數據管理貫穿信息收集、整理、貯存、發(fā)布、服務等全過程,內容包括信息網絡、應用系統(tǒng)、信息的采集和發(fā)布及相關的管理體制、程序、實施模式和項目管理。
當前,國內政府數據管理的主要特征為:
一是政府部門對數據資源的獨占性較為嚴重。據統(tǒng)計,目前國內約80%的社會信息資源由政府部門控制,這種局面是在長期計劃經濟體制下形成的。改革開放以來,雖然信息服務市場的需求情況已發(fā)生了很大變化,但在信息服務供給方面,數據資源開發(fā)以政府為主,信息系統(tǒng)建設為政府服務,相關投入由政府資助的基本格局并沒有發(fā)生根本性的改觀。
二是數據共享性較差。數據共享意識較落后,部分政府部門認為擁有數據越多,權力就越大,不愿把數據資源在網上共享。部分行業(yè)(部門)各自開發(fā)自己的網上數據服務系統(tǒng),信息產品重復、不足與閑置并存,造成資源的嚴重浪費,也不能形成規(guī)模優(yōu)勢和效益。在現(xiàn)有國內的3000多個數據庫中,真正流通起來被利用的不足10%。公用信息與保密信息的界限不明,數據價值無法確定。在全國范圍內目前還未形成通過網絡利用政府數據資源的態(tài)勢,且缺乏行之有效的組織和辦法,網上可利用的政府信息資源較少。
三是政府數據資源管理系統(tǒng)標準不統(tǒng)一。盡管我國的政府信息化建設已經歷了20年的時間,國家在這方面也投入了大量的財政資金,我國政府辦公業(yè)務網(政務內網)已基本建成,政府公眾信息網(政務外網)也形成了相當規(guī)模。但是由于標準不一、各自為政、自成一體、不聯(lián)不通,缺乏有效整合,政府大小部門問最終形成了一個個“信息孤島”,隔斷了部門內業(yè)務上的內在聯(lián)系,致使豐富的數據資源難以得到共享,大量資金投入的結果,卻不能獲得為社會提供便利的政府公共服務的回報。
四是缺乏統(tǒng)一的、常設的管理協(xié)調機構。我國政府組織結構是縱向層級制和橫向職能制交叉組成的二維模式,政府對數據資源并未做統(tǒng)一的管理,也沒有設立相應的統(tǒng)一的管理機關。當需要對跨部門的信息資源進行管理時,只能設立臨時性的協(xié)調、管理機構。因缺乏統(tǒng)一的、常設的管理協(xié)調機構,我國政府的信息資源管理表現(xiàn)為缺乏監(jiān)督和協(xié)調,壁壘林立,沒有統(tǒng)一的標準,沒有統(tǒng)一的目標,也沒有統(tǒng)一的政策及指導思想,管理相對混亂。
五是數據收集、加工、存儲、利用的規(guī)范性差。目前與數據資源管理相關的只有《檔案法》、《保密法》、《統(tǒng)計法》等少數法律。從總體上來看,這些法律對相關數據信息管理的程序、期限、方式等方面的規(guī)定都比較簡單。尤其是實際工作中,數據管理人員多傾向于保密,因為不公開就無須承擔責任,若公開的話,則有可能要冒因公開不當而導致泄密的風險。由于法律、法規(guī)缺位,行政機關對數據資源管理認識的缺乏以及行政機關工作經驗的不足,導致現(xiàn)階段我國的數據管理處于相對隨意的狀況。[page]
二、國內外促進大數據發(fā)展的案例分析及經驗啟示
(一)國外政府及國際組織應用案例
1、英國——政府在關鍵行業(yè)的大投資獲得大回報
英國政府在大數據應用方面無疑是走在全球前列的,2010年1月以來,英國政府OpenData網站的人均訪問頁面數增長了285%,總訪問量比法國和美國(data.gov)的同類網站還要高??梢钥闯鲇诖髷祿I域的大手筆投資已經開始收到回報:一份行業(yè)報告顯示,英國政府通過高效使用公共大數據技術每年可節(jié)省約330億英鎊,相當于英國每人每年節(jié)省約500英鎊。
雖然經濟不景氣,財政被迫收緊,但大數據依然是英國政府舍得為之一擲千金的“寵兒”。2013年年初,英國商業(yè)、創(chuàng)新和技能部宣布,將注資6億英鎊發(fā)展8類高新技術,大數據獨攬其中的1.89億英鎊。
英國首個綜合運用大數據技術的醫(yī)藥衛(wèi)生科研中心坐落在牛津大學。這一中心的成立給英國醫(yī)學研究和醫(yī)療服務帶來革命性變化,它促進醫(yī)療數據分析方面的新進展,幫助科學家更好地理解人類疾病及其治療方法。
這個研究中心總投資達9000萬英鎊,可容納600名科研人員。中心通過搜集、存儲和分析大量醫(yī)療信息,確定新藥物的研發(fā)方向,從而減少藥物開發(fā)成本,同時為發(fā)現(xiàn)新的治療手段提供線索。
作為新生事物,大數據的發(fā)展仍面臨許多挑戰(zhàn)。牛津大學統(tǒng)計學教授彼得·唐納利認為目前大數據技術的一個瓶頸就是信息采集,拿牛津大學新成立的醫(yī)藥衛(wèi)生科研中心來說,首先要有足夠量的病人、藥物等相關信息,這是數據分析的基礎,然而許多病人可能出于隱私考慮不愿提供這些信息,制藥企業(yè)也有可能因為商業(yè)利益不愿共享藥物成分等敏感信息。
要從海量數據中得出有用結論,專業(yè)的數據分析是關鍵。牛津大學教授羅里·柯林斯認為,采集到足夠信息后,需要由相關領域的專業(yè)人士與信息技術專家一起對數據進行有針對性的歸納和分析,而這種跨學科、跨領域合作能否順利實現(xiàn),也是大數據實際應用中的一個問題。
2、美國——注重區(qū)域及行業(yè)應用,以人為本,小項目大回報
相比英國政府高投入高回報相比,美國政府的大數據計劃開展比較早,形式更松散,效益回報分布在社會的各個方面。
例如西雅圖市與微軟和埃森哲試點大數據節(jié)能項目。項目基于微軟的Azure云計算平臺,將手機和分析來自四個城區(qū)建筑管理系統(tǒng)的數百個數據集。通過預測分析工具,大數據系統(tǒng)能找出可行的節(jié)能措施,預計目標是將耗電量降低達到25%。
專為車主停車開發(fā)的一個手機應用,支持iOS和Android手機,能夠跟蹤入網城市的停車位。用戶只需要輸入地址或者在地圖中選定地點,就能看到附近可用的車庫或停車位,以及價格和時間區(qū)間。該移動應用能夠實時跟蹤停車位數量變化,目前已經能夠實時監(jiān)控包括華盛頓、紐約、芝加哥、巴爾的摩、波士頓、密爾沃基和紐瓦克等七個城市的停車位。有效緩解了上班高峰的停車問題。
在面對暴雪等災害天氣時,美國的地方政府也通過大數據進行非常獨特的控制和管理,例如波士頓和芝加哥每到冬季就會有很厚的積雪,波士頓新城區(qū)辦公室發(fā)布了一款名為:“領養(yǎng)消防栓”的移動應用,芝加哥市政府則類似的推出“領養(yǎng)人行道”的應用。這兩款應用作為大數據終端,能夠收集和傳遞大雪時道路和消防栓被積雪掩埋的信息,同時能夠在城市志愿者的幫助下,對于已經清理積雪的人行道、消防栓,及時的上報情況。這些數據被傳遞到城市的路況監(jiān)測中心,為市民雪天出行提供了可靠的信息。
無論是英國政府的集中投資、上大項目的方式,還是美國以城市為單位小投資大效用的項目建設理念,都可以看出無論投資規(guī)模,大數據分析對政府職能優(yōu)化,提升城市管理能力,降低政府管理成本都能起到極大的推動作用。
3、世界銀行——大數據提高援助效果,遏制財務腐敗
繼歐美等國政府乃至聯(lián)合國紛紛宣布推動開放數據計劃(Open Data)后,世界銀行也奮不顧身的投入到大數據分析的浪潮之中。世界銀行的開放數據計劃是一個由世界銀行與其他機構,包括聯(lián)合國發(fā)展計劃署,聯(lián)合國商業(yè)發(fā)展署,UNGlobalPulse以及卡塔爾計算研究院等共同參與的一個計劃。由世界銀行的開放財務團隊以及非盈利組織DataKind發(fā)起的8個項目組成。在推動社會組織之間在數據與發(fā)展之間的合作。
比如,在利用肯尼亞的糧食價格,香蕉和大米的消費量可以快速地分析和預測當地的通貨膨脹率。從而為更合理地對當地進行援助提供支持。此外,世界銀行利用“主動式的數據分析來保證企業(yè)的反腐敗合規(guī)”。針對歐美各國的企業(yè)反腐敗法規(guī),傳統(tǒng)的企業(yè)自檢方式是企業(yè)檢查自身的規(guī)章制度是否符合法規(guī)的要求,然后對一些交易進行抽查。不過,既然大部分企業(yè)都已經存儲了他們的財務數據,隨著大數據分析的普及,企業(yè)的內部審計人員就可以利用數據分析工具和技術,對那些高風險的交易進行“定點”檢查了。而一旦發(fā)生了違法行為,企業(yè)具有針對反腐敗的數據分析也能夠幫助企業(yè)減輕一部分法律責任。
比如,通過大數據分析,企業(yè)可以確定一些高風險的交易類型。如那些與政府部門往來的資金,分析涉及大額現(xiàn)金的交易,或者涉及招投標方面的交易等等。內部審計可以針對這些項目進行專門的審查。
(二)國內地方案例
1、廣東省——率先啟動大數據戰(zhàn)略
2012年12月廣東省率先啟動大數據戰(zhàn)略,根據《廣東省實施大數據戰(zhàn)略工作方案》,廣東省將建立省大數據戰(zhàn)略工作領導小組等,為保證大數據戰(zhàn)略有效實施,廣東省還將建設政務數據中心,并為高等院校和企業(yè)等成立大數據研究機構提供支持。廣東省還將在政府各部門開展數據開放試點,并通過部門網站向社會開放可供下載和分析使用的數據,進一步推進政務公開。
廣東省將采用行政收集、網絡搜取、自愿提供、有償購買等多種方式拓寬數據收集渠道。同時,全省網上辦事大廳、政府數據檔案、企業(yè)信用信息網等骨干網絡系統(tǒng)正在建設和完善過程中。
廣東不僅是全國率先開展網絡問政的省份,而且政府微博數量也位居全國第一。目前,全省已初步建成集信息公開、網上辦理、便民服務、電子監(jiān)察于一體的網上辦事大廳,首批45個省級單位和21個地市已全部進駐,并面向企業(yè)和民眾提供“一站式”辦事服務。
此外,廣東省已經建立了一個橫向聯(lián)通112個省級單位、縱向連接21個地市和121個縣(市、區(qū))的電子政務網絡平臺。同時,省級電子政務信息資源共享平臺也已建成,實現(xiàn)了35個省級部門、185類信息的網絡共享。
另外,與大數據相配套的數據分析工作也在有條不紊的進行著,包括數據分析人才的培養(yǎng),數據分析行業(yè)的發(fā)展。項目數據分析師廣東授權管理中心,負責數據分析人才的培養(yǎng)工作。
2、重慶市——發(fā)布行動計劃、明確目標任務
重慶市政府在2013年7月發(fā)布《重慶市大數據行動計劃》,明確提出要推動企事業(yè)單位數據共享開放,加快大數據產業(yè)布局,促進大數據技術及解決方案在公共服務、城市管理及產業(yè)發(fā)展等方面的廣泛應用;并提出打造2-3個大數據產業(yè)示范園區(qū),培育10家核心龍頭企業(yè)、500家大數據應用和服務企業(yè),引進和培養(yǎng)1000名大數據產業(yè)高端人才,形成500億元大數據產業(yè)規(guī)模,實現(xiàn)大數據技術在電子商務、工業(yè)制造、交通物流、醫(yī)療衛(wèi)生、食品藥品安全、金融、傳媒等行業(yè)的全面應用。
3、南京市——與智慧城市建設相結合
2013年南京市發(fā)布了《2013年全市社會信息化工作要點》,今年南京市“智慧南京”建設將加快推進,基本實現(xiàn)市民卡城鄉(xiāng)居民全覆蓋。此外,無線寬帶網絡、智慧醫(yī)療、智慧旅游、數字化節(jié)能、等領域的信息化建設,將直接改變廣大市民的生活。
“智慧醫(yī)療”將越來越多地體現(xiàn)在市民看病拿藥中。繼續(xù)深化市民卡在醫(yī)療行業(yè)的應用,推進醫(yī)療服務智能化、健康管理智能化,推進預約掛號服務與his、排隊叫號系統(tǒng)深度對接。實行多種途徑掛號、分時段掛號、多種方式支付、預付費后結算;加快推進急救車載系統(tǒng)和智能調度系統(tǒng)建設,向急救車輛提供實時路線導引,實現(xiàn)與現(xiàn)場雙向互動,提高急救資源使用效率;加快推進南京區(qū)域衛(wèi)生信息平臺建設,逐步實現(xiàn)醫(yī)院電子病歷數據與市、區(qū)平臺健康檔案數據的自動歸檔、自動更新,與公共衛(wèi)生、醫(yī)療保障、藥品監(jiān)管、基層醫(yī)療衛(wèi)生服務機構以及相關單位進行信息交換與共享;進一步加大新農合人群市民卡發(fā)卡力度。
南京將開展全市道路停車泊位管理智能化項目建設,構建全市停車管理服務平臺,依托車輛智能卡和市民卡,實現(xiàn)停車泊位信息共享和誘導、停車費陜捷支付、停車收費監(jiān)督等功能;推進河西地區(qū)智能交通應用試點,通過智能信號控制實現(xiàn)交通的動態(tài)管理,促進公交優(yōu)先戰(zhàn)略實施。
(三)經驗與啟示
1、大數據上升到國家戰(zhàn)略的層次
大數據所帶來的社會變革已經深入到人們生活的各個方面,日常的出行、購物、運動、理財等等。從目前國內外大數據發(fā)展歷程和趨勢來看,掌握海量有效數據和具有強大數據處理分析能力的公司和企業(yè)將走在大數據發(fā)展的前沿。為了掌握更多數據,各大企業(yè)均在搶占互聯(lián)網入口,包括移動瀏覽器、搜索引擎、操作系統(tǒng)、應用商店等。
大數據的發(fā)展從以Google、Amazon、Yahoo!為代表的互聯(lián)網大公司,蔓延到越來越多的創(chuàng)業(yè)公司以及金融、電力、電信等各種傳統(tǒng)行業(yè),這些公司和行業(yè)在不同的維度進行數據挖掘和分析,創(chuàng)造出更多的商業(yè)模式和經濟增長點。同時,包括美國在內的諸多國家,都將大數據管理上升到國家戰(zhàn)略層面,從國家層面通盤考慮其發(fā)展戰(zhàn)略。
2、大數據仍處于初級發(fā)展階段
大數據的核心價值在于預測和決策。從數據到信息,再到知識,最后形成智慧,這是一個通過大量數據挖掘,不拘泥于過往因果認識,重新發(fā)現(xiàn)新規(guī)律,對行為進行判斷的過程。通過大數據挖掘所發(fā)現(xiàn)的因果關系,不僅能揭示存在的規(guī)律,而且能夠預測未來發(fā)展趨勢。一言以蔽之,大數據的意義,就在于能夠通過服務和管理來積累數據,再通過數據的挖掘和預測來提升服務和管理水平。
但真正大數據運用仍處于發(fā)展初級階段。據美國麥肯錫咨詢機構在其一份關于大數據研究報告中指出,大數據已經對美國健康醫(yī)療、歐洲的政府公共管理、個人位置數據、美國的零售業(yè)及制造業(yè)等五個部門產生了重大的經濟影響。據市場研究中心統(tǒng)計分析發(fā)現(xiàn),目前我國在公共領域對大數據的運用主要集中在電力行業(yè)、智能交通、電子政務、司法系統(tǒng)等四個方面。
3、大數據對政府服務能力有促進作用
通過政府信息化,大數據能夠提高政府決策的科學性和精準性,提高政府預測預警能力以及應急響應能力,節(jié)約決策的成本。以財政部門為例,基于云計算、大數據技術,財政部門可以按需掌握各個部門的數據,并對數據進行分析,做出的決策可以更準確、更高效。另外,也可以依據數據推動財政創(chuàng)新,使財政工作更有效率、更加開放、更加透明。
當前,我國正處在全面建成小康社會征程中,工業(yè)化、信息化、城鎮(zhèn)化、農業(yè)現(xiàn)代化任務很重,建設下一代信息基礎設施,發(fā)展現(xiàn)代信息技術產業(yè)體系,健全信息安全保障體系,推進信息網絡技術廣泛運用,是實現(xiàn)四化同步發(fā)展的保證。大數據分析對我們深刻領會世情和國情,把握規(guī)律,實現(xiàn)科學發(fā)展,做出科學決策具有重要意義,我們必須重新認識數據的重要價值。
4、大數據需要機制體制上的創(chuàng)新和突破
中國人口居世界首位,將會成為產生數據量最多的國家,但我們對數據保存不夠重視,對存儲數據的利用率也不高。此外,我國一些部門和機構擁有大量數據卻不愿與其他部門共享,導致信息不完整或重復投資。政府應通過體制機制改革打破數據割據與封鎖,應注重公開信息,應重視數據挖掘。
當前,大數據的政府應用有兩個值得研究的方向。其一是跨界應用,跨界應用能打破信息壁壘,提高政府職能部門間信息傳遞和確認的速度。另一個方向則是開放運用,這是國內各級政府進展較慢的領域。從美國政府開放數據以來,很多國家和地區(qū),如新加坡、韓國、日本、加拿大、歐盟都在效仿,甚至一些非洲國家也不甘落后。但在國內,雖然如北京、上海等地區(qū)開放數據的說法已提了很多年,國信辦還下發(fā)34號文倡導此事,但是各地方開放數據的第一步依然沒有邁出去。[page]
三、上海“大數據”發(fā)展的現(xiàn)狀及主要問題
(一)上海市政府信息資源的現(xiàn)狀
1、城市基礎數據庫基本建成
基礎數據庫是本市政務信息資源開發(fā)利用的基礎。“十一五”期間,上海市堅持“一數一源,一源多用”,以跨部門應用系統(tǒng)建設帶動政務信息資源的開發(fā)利用,重點圍繞人口、法人及空間地理信息,完善了集中與分布相結合的基礎數據庫建設。
2、制度建設不斷完善
上海政府信息公開工作起步早,走在全國前列,經過多年的探索和實踐,目前已初步建立了較為完整的信息公開制度體系。早在2004年,上海就制定出臺了《上海市政府信息公開規(guī)定》(以下簡稱《信息公開規(guī)定》),并確定了“公開為原則,不公開為例外”的總體要求。2008年,在國務院《信息公開條例》的基礎上,上海進一步修改完善了《信息公開規(guī)定》。2009年,下發(fā)了《關于進一步加強政府信息公開工作的若干意見》(以下簡稱《若干意見》),提出了6大類30條109項工作任務,并逐一明確了責任部門和工作要求。此外,為配合《信息公開規(guī)定》和《若干意見》的實施,上海率先于全國出臺了一系列配套的規(guī)章制度,如主動公開政府信息送交制度、信息公開年度報告制度等,為加大政府信息公開力度提供了較完善的制度保障。
3、信息目錄庫建設有序推進
在公文類信息方面(非結構化數據),建立了公文類政府信息目錄備案管理系統(tǒng),形成全市公文類信息目錄庫,為全面掌握全市公文類信息底數、加強公開屬性審核管理、提供全市公文類信息“一站式”檢索服務奠定了基礎。在非公文類政務信息資源方面(結構化數據),在資源梳理、資源分類、資源編目等方面進行了試點實踐,并形成了本市政務信息資源編目和注冊的試點規(guī)范和標準。同時,組織開發(fā)了上海市政務信息資源目錄服務平臺原型,各試點單位向目錄服務平臺開展目錄備案工作。
4、推進機制不斷健全
為加強政府信息公開工作的組織領導,上海不斷完善信息推進機制建設。2004年建立了政府信息公開聯(lián)席會議制度;2008年5月,按條例要求,政府信息公開主管部門作了調整,市政府辦公廳、市法制辦、市經信委、市監(jiān)察局、市政府新聞辦、市國家保密局等聯(lián)席會議成員單位合力做好信息公開各項推進工作;2009年,市政府辦公廳新“三定”方案增加了主管指導、推進、協(xié)調、監(jiān)督政府信息公開工作的職責;2010年,市政府辦公廳政府信息公開處成立。同時,各區(qū)縣、各部門也相應建立了信息公開聯(lián)席會議或領導小組,明確了分管領導,設立了工作機構。此外,上海還建立了一系列配套工作機制,如建立健全依申請公開咨詢會商機制、保密審查機制、信息發(fā)布協(xié)調機制、監(jiān)督保障機制等,以有效推進政府信息公開工作,及時處理工作中出現(xiàn)的熱點難點問題。
5、公開內容不斷豐富,公開渠道不斷拓寬
從內容看,上海政府信息公開的理念重在“保證公眾對政府行政信息的知情權,以促進政府依法行政”,因此,《上海市人民政府關于進一步加強政府信息公開工作的若干意見》中提出,政府信息公開的內容主要側重在“資金、項目、政策、服務”等領域。從渠道看,為滿足公眾多層面的信息需求,上海不斷探索政府信息公開渠道,目前已形成政府網站為主,新聞發(fā)布會、政府公報、國家檔案館、公共圖書館、政府信息公開查閱點、社區(qū)信息苑和農村基層信息服務站等為補充的覆蓋城鄉(xiāng)、多層次的公開渠道,有力地加大了政府信息公開力度,在一定程度上為確保公眾知情權提供了保障。
(二)上海市大數據應用存在的主要問題
現(xiàn)狀來看,上海市政府數據資源管理存在著對政府信息資源蘊藏的巨大價值認識不夠、政府信息資源的家底不清、部門問數據信息共享不充分,統(tǒng)計制度改革滯后造成一些重要的經濟社會統(tǒng)計數據公布缺少穩(wěn)定性和連續(xù)性、以及部分重要信息匯聚的平臺還未建成等問題。具體表現(xiàn)為:
1、政府信息資源公開有待加強
上海雖然缺少天然的土地、礦藏和能源等傳統(tǒng)資源,但在建設“四個中心”和“世界城市”的過程中累積了極為豐富、獨具優(yōu)勢的信息資源,這塊資源為上海降低商務成本提供了一個可靠的抓手,因為它可以同時提供給眾多信息服務企業(yè)加工增值。當前,上海政府信息公開工作主要按照中央要求,解決公眾的“知情權”,以更好地依法行政、接受群眾監(jiān)督。但是隨著上海經濟領先全國發(fā)展,解決企業(yè)、社會組織對政府信息資源的“使用權”問題,促使政府、企業(yè)及社會對數據資源的共同分析應用已迫在眉睫。
2、非公文類政務信息資源編目工作有待推進
全面梳理政府部門的數據和信息資源,建立信息資源目錄體系,是政府部門間信息共享及向社會開放的一項基礎性工作。目前,上海市統(tǒng)一的公文類信息目錄庫已基本建成,但非公文類政務信息資源(結構化數據),盡管已在資源梳理、資源分類、資源編目等方面形成了上海市政務信息資源編目和注冊的試點規(guī)范和標準,但從全市范圍看,由于涉及的部門眾多,任務繁重,各部門對編制政務資源目錄體系重要性的認識不一,且受人力、物力、財力所限,部門對非行政信息進行深加工的積極性和動力不足,一定程度上延緩了市政府部門信息共享及對社會開放的進程。
3、城市基礎信息尚未在政府部門之間實現(xiàn)有效共享
經過多年努力,上海市已經基本建立起了包括人口、法人、空間地理、交通、房地產等多個領域在內的城市基礎數據庫,在一定程度上解決了城市運行所需的各類基礎信息的匯聚問題。但從應用情況看,除了少數數據庫(如人口庫、法人庫等)在業(yè)務相關的委辦局之間實現(xiàn)了部分數據交換和信息共享外,大部分基礎數據庫在政府部門問的共享并不充分,更不用說對社會開放了。這種數據和信息沒有在政府部門間充分共享的狀況,不僅不利于提高政府部門分析決策能力和工作效率,也制約了政府部門的數據和信息向社會開放。
4、部分重點領域統(tǒng)一的數據匯聚平臺還未形成
上海已形成的統(tǒng)一匯聚平臺的數據庫,大多集中于城市運行基礎領域(如法人庫、人口庫、空間地理信息交換平臺等),而對于經濟社會某些重點發(fā)展領域的行業(yè)性統(tǒng)一數據平臺仍較缺乏。經濟領域來看,金融、貿易中心建設發(fā)展的相關數據仍分散于不同的政府部門,集中式的數據平臺仍未建立。社會領域,包括氣象、城市管理等在內的數據信息,受關注的程度日益提升,集中統(tǒng)一的信息平臺亟待建立。[page]
四、對策建議
目前情況看,上海各條線系統(tǒng)相對較多,協(xié)同共享項目相對較少,數據共享和交換主要障礙是信息交換不對稱等問題。在今后的信息化建設中可能更多的工作將是信息化協(xié)同共享項目。從審批上控制新增信息化建設,使得新增信息化項目在審批的制約下走向集約化。在政府管理層面逐步實現(xiàn)購買服務的形式推進信息化建設。在初始階段對在信息化服務提供企業(yè)進行扶持,在成長之后放歸市場進行競爭。
(一)建立數據管理機構統(tǒng)籌數據治理工作
1、組織架構
鑒于政府大數據管理涉及到整個政府部門,建議在市級層面建立更高層面、統(tǒng)籌度更高的數據協(xié)調管理機構,由該管理機構負責統(tǒng)一數據規(guī)范標準,明晰數據分布情況,把分布在各部門之間的數據統(tǒng)籌管理服務,提升上海在大數據背景下政府對數據的管理能力。
全市層面的數據中心可分屬三個數據中心群:SDC-1市級各委辦局信息中心、SDC-2市場各行業(yè)、WDC世界數據中心(見圖2)。SDC-1下包含各區(qū)級委辦局信息中心,SDC-2下包含政策形勢、上海產業(yè)、上海企業(yè)、上海經驗、上海人物、上海招商、上海競爭力等目錄,涉及宏觀綜合數據、經濟中心數據、金融中心數據、貿易中心數據、航運中心數據、經濟轉型數據、能源環(huán)保數據等不同指標數據。與世界數據中心(WDC)合作打開國際性數據合作方向。主要包括:WDC-A美國、WDC-B前蘇聯(lián)、WDC-C歐洲和日本、WDC-D中國。目前,中國的數據中心主要成立九個分中心(見表2)。數據中心能更好地打開政府各部門間、政府與市民間的邊界,提高各機構協(xié)同辦公效率和為民辦事效率,同時提升政府社會治理能力和公共服務能力。在城市管理和服務的過程中,使已有數據透明化,使數據的提供方和數據的需求方有效對接找到有效途徑。
2、管理職能
市級層面數據中心管理構架(如圖3),主要分為日常運行管理及應急聯(lián)動管理兩類,制定統(tǒng)一數據信息安全管理標準、信息數據標準化格式。同時明確數據使用、數據安全、數據發(fā)布、相關者的權力、法律保護、監(jiān)管機構、對數據的特殊使用、特殊使用的種類、處罰規(guī)定、過渡和最終規(guī)定等。
數據中心通過對三個數據中心群的統(tǒng)籌管理和系統(tǒng)化運行,承擔同化、編目、分類檢索、發(fā)布、制定數據公開查詢辦法。數據同化是將碎片數據系統(tǒng)化、統(tǒng)一制定數據格式標準化(一級數據源)。數據編目是按照一級、二級數據層次采用自然歸類法進行系統(tǒng)編目,使數據層次清晰,口徑一致,統(tǒng)籌管理。數據分類檢索是對各數據中心群提供的數據,根據編目建立數據查詢系統(tǒng),并引導需求方更快地搜索到相應機構部門的數據,數據統(tǒng)一對外發(fā)布管理,理清數據分布結構、公開數據獲得途徑。在大數據背景下,開放數據的意義,不僅僅是滿足公民的知情權,更在于讓大數據時代最重要的生產資料數據自由地流動起來,以催生創(chuàng)新,推動知識經濟和網絡經濟的發(fā)展,更好地促進上海的創(chuàng)新驅動、轉型發(fā)展。
(二)搭建統(tǒng)一、共享的基礎數據平臺
公共數據應該被作為公共資源向公眾開放,建議在目前基礎信息數據資源基礎上,整合建立更加統(tǒng)一、共享度更高的基礎數據平臺,形成基礎庫、專業(yè)庫、應用庫,有效提升政府服務效率和社會管理水平。
基礎庫,建立集人口庫、法人庫和城市地理空間信息系統(tǒng)三大基礎庫于一體的數據共享平臺。有效掌握居民、企業(yè)、城市公共基礎設施等大量有效實時數據,推進政府非結構化數據的挖掘與運用。打破傳統(tǒng)低效方式,即采用OCR等傳統(tǒng)文字識別軟件掃描進入系統(tǒng),缺點是往往對文件格式有特殊的要求,無法應對非結構化數據多樣性的問題。通過構建智能獲取、有效管理、快速流轉、及時搜索這四方面功能的整合性技術平臺,包括輸出管理解決方案,流程管理和內容管理解決方案。將非結構化信息快速提取、轉化成結構化數據,并和核心系統(tǒng)有效連接起來,大大降低了管理和使用非結構化信息的難度。處理非結構化數據,有效管理這類數據,控制這類數據的增長,在實際使用中使這類數據成為信息結構的一部分,以便于決策及查找信息。有利于降低政府信息使用成本,提高行政效率。
專業(yè)庫,用大數據打造更細致貼心的政府公共服務。集醫(yī)療、教育、交通等數據庫于一體,提高政府便民服務的主動性、公開性、透明性。比如,公共醫(yī)療服務,引導醫(yī)院通過采取云存儲架構,提高診斷效率,緩解醫(yī)療資源緊張,降低整體數據管理成本,把醫(yī)療數據轉化為生活數據,將日常生活個人身體信息進行收集分析。使醫(yī)療信息進一步融入個人生活。對于“信息高速公路”的擁堵提示,防止網絡供應商的壟斷,提高其透明度,確保居民享受公平公正市場環(huán)境下的自由自主選擇。
應用庫,提供更符合社會應用需求的大數據服務庫。大數據作為一種重要的戰(zhàn)略資產,已經不同程度地滲透到每個行業(yè)領域和部門,其深度應用不僅有助于企業(yè)經營活動,還有利于推動國民經濟發(fā)展。在上海努力實現(xiàn)“創(chuàng)新驅動、轉型發(fā)展”發(fā)展方針的指引下,提高大數據成果在各相關部門的分享程度,提高整個管理鏈條和產業(yè)鏈條的投入回報率,更好地培育出一批商業(yè)模式、產品和服務創(chuàng)新的新興產業(yè),為創(chuàng)新注入新動力,推動轉型發(fā)展。
(三)加強信息資源開放力度,鼓勵市場化應用
借鑒發(fā)達國家經驗,加強原始數據的歸集與處理,創(chuàng)新體制機制,進一步通過市場化手段,促進政府信息資源的開發(fā)利用水平??紤]到政府信息資源向社會開放的現(xiàn)實基礎,以及工作的復雜性與艱巨性,實際操作時,統(tǒng)籌考慮不同類別信息服務業(yè)企業(yè)、社會組織及個人需求的緊迫程度和政府信息資源開放對經濟社會發(fā)展的作用,在特定領域、聚焦重點,針對數據開放呼聲較高的政府部門開展試點開放,鼓勵形成具有典型性和代表性的市場化數據開發(fā)利用模式與體制機制。
(四)創(chuàng)新管理途徑。保障公眾數據安全
大數據時代,信息安全已經成為一個核心問題,對信息進行隱私保護是政府對數據管理的職責之一,需要圍繞數據的歸集與使用,進行規(guī)范化、制度化設計。首先需要對“數據”進行明確定義,從內容上可以分一般數據和敏感數據,一般數據包括姓名、年齡、住址等,敏感數據包括宗教、信仰、健康狀況等等。上述所有數據都因受數據法的保護。同時規(guī)定調查、采集、儲存、留存、整理、比較、修訂、鏈接、復制、征詢、發(fā)放、轉讓、封鎖、刪除、銷毀以及其他各種形式的處理,均屬于“數據處理”。如果收集的數據會進入政府部門或企業(yè)機構的自動處理程序,則需要向數據監(jiān)管機構報告。
同時數據監(jiān)管機構要規(guī)定服務商的義務:如禁止擅自傳送采集的數據;必須采取必要的數據安全措施;只能雇用向公司承諾為數據保密或依法宣誓保密的人;要與委托人簽署包括知情權、糾正權、刪除權、轉送權等內容的委托合同;每筆業(yè)務完成后,除非委托方委托留存,否則要銷毀;要向委托人提供相關數據,以便其向監(jiān)管機構報告。通過嚴格的數據保護措施,一方面可以提升民眾的數據保護意識,另一方面也給了消費者一個相對干凈的使用環(huán)境。
管理上的兩個創(chuàng)新途徑:創(chuàng)新途徑一,“差別隱私”,將數據模糊處理,促使對大數據庫的查詢不能顯示精確的結果,只有相近的結果。個人隱私保護從個人許可到數據使用者承擔責任的轉變是一個本質上的重大變革。大數據時代,需要設立新型的隱私保護模式,該模式應更著重于數據使用者為其行為承擔責任。監(jiān)管機制可以決定不同種類的個人數據必須刪除的時間,再利用的時間框架則取決于數據內在風險和社會價值觀的不同。創(chuàng)新途徑二,“大數據審計員”,在使用預測分析時考慮個人動因以及催生大數據審計員。評估數據源的挑選,分析和預測工具的選取,包括運算法則和模型,以及計算結果的解讀是否正確合理。一旦出現(xiàn)爭議,有權考察與分析結果相關的運算法則、統(tǒng)計方法以及數據集。采取這一靈活的自我監(jiān)管方式的專業(yè)人員保護大眾利益,與政府共同商議公共領域大數據的最佳使用辦法。
(五)提升大數據輔助科學決策水平
除提供服務外,還要進一步發(fā)揮大數據在提高政府部門決策的科學化水平方面的突出作用。大數據是信息化發(fā)展到一定階段的必然產物。其本義是對數據的開發(fā)利用,以支撐科學決策,追求以最小的資源消耗,獲得最大的價值。安全、效率、成本是其科學化決策的重要依據。在掌握實時數據的運行管理系統(tǒng)下,能更清楚地了解群眾需求、人口變動情況,從而更準確地進行規(guī)劃、布局,提升政府公共服務。上海在努力建設智慧城市中已經應用了大數據的理念。通過利用客觀存在的海量數據,能夠有效降低調查成本。
為了更好地促進經濟發(fā)展,應鼓勵促進政府部門、社會組織及研究機構,加大開發(fā)、應用大數據輔助決策的力度,在輔助決策的流程、方式、展示與工作機制等方面加快創(chuàng)新,使決策部門可以更敏銳地把握經濟社會發(fā)展走向,制定并實施科學的公共政策,從而提高數據及時性、準確性。