一、引言
 
  信息、計算以及通信技術(shù)的飛速進展持續(xù)滲透至人類社會生活的方方面面,逐漸成為越來越多日?;顒拥幕A,引發(fā)人類學習、溝通、協(xié)調(diào)、生產(chǎn)及消費方式的轉(zhuǎn)變,這樣的轉(zhuǎn)變被Rifkin稱為第三次工業(yè)革命。在物聯(lián)網(wǎng)技術(shù)突破數(shù)據(jù)采集瓶頸,寬帶泛在突破數(shù)據(jù)傳輸與交換瓶頸,云計算突破數(shù)據(jù)存儲與大規(guī)模運算瓶頸時,數(shù)據(jù)的爆炸式增長成為這個時代的重要特征,引發(fā)近年全球范圍的“大數(shù)據(jù)”(Big Data)熱潮。與大數(shù)據(jù)的關注熱度相比,它的概念界定一直未在學術(shù)界和實踐界形成共識,無論美國國家科學基金會(NSF)從數(shù)據(jù)規(guī)模、形態(tài)角度的定義,還是Gartner公司從數(shù)據(jù)處理方式角度的定義,亦或維基百科從數(shù)據(jù)處理復雜性角度的定義,在初步勾勒了大數(shù)據(jù)基本特征的同時,仍有管中窺豹之感。某種意義上說,對大數(shù)據(jù)的關注反映了當人類掌握的基礎數(shù)據(jù)管理技術(shù)(如采集、存儲與傳輸)發(fā)展快于高級數(shù)據(jù)管理技術(shù)(如分析、知識挖掘與決策支持)時,公眾面對大量可見而不可知數(shù)據(jù)的焦慮。大數(shù)據(jù)的“大”是相對于信息認知能力而言的,與海量數(shù)據(jù)相比,對人類真正有意義的是其背后蘊含的知識。因此“大數(shù)據(jù)”絕不僅是計算機科學中的極端數(shù)據(jù)處理問題,相關研究的突破和進展離不開數(shù)據(jù)分析方法與特定管理問題背景的深度融合。
 
  幾乎所有展望大數(shù)據(jù)應用前景的研究都非常重視政府或公共部門相關數(shù)據(jù)的價值。這很大程度上是因為這些數(shù)據(jù)關乎國計民生,有可能得到那些可能解決重大問題的重要分析結(jié)果。但實際上,基于大數(shù)據(jù)解決大問題并不那么容易。無論在國外還是國內(nèi),真正意義上的系統(tǒng)性大數(shù)據(jù)分析探索均率先出現(xiàn)在電子商務領域。如果說商業(yè)領域的大數(shù)據(jù)分析大多附著在體現(xiàn)企業(yè)核心價值的交易數(shù)據(jù)上是因為這是客戶行為的記錄,公共領域的大數(shù)據(jù)分析也同樣關注“客戶反饋”,例如社交媒體上更易獲得的網(wǎng)絡公眾輿情。當然,面對通常被認為是多目標決策的公共管理復雜問題,單一的網(wǎng)絡輿情分析往往得到的知識是有限的,分析對象的邊界亟待拓展。
 
  在此背景下,本文的討論圍繞公共衍生大數(shù)據(jù)(Public Generated Big Data)的概念,指圍繞公共話題和公共事務衍生的復雜、多樣、低價值密度的海量數(shù)據(jù)。公共衍生大數(shù)據(jù)通常主要包含以下三類:互聯(lián)網(wǎng)公共話題相關的用戶創(chuàng)造內(nèi)容(User Generated Content, UGC);政府部門業(yè)務運作過程中產(chǎn)生的大量政策、法規(guī)及其相關的文件與文檔數(shù)據(jù);政府信息化過程中建設的包括物聯(lián)網(wǎng)系統(tǒng)在內(nèi)的各類信息系統(tǒng)在運行中生成的大量數(shù)據(jù)(如交通、環(huán)境監(jiān)測、網(wǎng)上辦事數(shù)據(jù))。本文將基于過往研究及未來挑戰(zhàn),嘗試初步構(gòu)建上述大量有價值但卻未得到充分利用的公共衍生大數(shù)據(jù)與政府科學決策間的可能聯(lián)系。
 
  二、公共衍生大數(shù)據(jù)分析方法發(fā)展
 
  之所以要將公共衍生大數(shù)據(jù)作為一個概念提出,并視為政府決策過程中一種可依賴資源,很大程度上基于近年來數(shù)據(jù)挖掘與社會計算方面取得的若干研究進展,這為我們更好的實現(xiàn)對公共衍生大數(shù)據(jù)的分析及后續(xù)的政府決策過程模擬與評估提供了可能。這些方法進展涉及的主要領域包括文本挖掘、社會網(wǎng)絡分析、社會計算與多智能體仿真等。
 
  在文本挖掘方面,無法利用計算機理解海量文本中的語義信息是長期以來文本形式的非結(jié)構(gòu)化數(shù)據(jù)無法像結(jié)構(gòu)化數(shù)據(jù)一樣被政策分析者充分利用的根本原因。概率主題建模一類方法即試圖從大量文本信息中發(fā)現(xiàn)并提取主題信息,從而實現(xiàn)面對非結(jié)構(gòu)化數(shù)據(jù)的輔助決策。該方法起初應用于信息檢索領域,隨后概率潛在語義分析方法(pLSA)被提出用以在概率框架下生成信息主題集合。通過間接對文檔中包含的主題信息的處理,TF-IDF模式以及向量空間模型提供了一種粗略的描述和建模文檔內(nèi)容和主題相似度的解決方案。為了解決此類模型和方法無法區(qū)分字面意思不相同而主題意義相同或相似情形的弱點,研究者引入了奇異值分解(Singular Value Decomposition)并提出了潛在語義分析方法(LatentSemantic Analysis, LSA),將高維的文檔詞語空間轉(zhuǎn)化映射成了低維的主題向量空間。潛在狄利克雷分配(Latent Dirichlet Allocation, LDA)使用貝葉斯概率框架進一步改進了pLSA模型和方法,取得了更好的建模效果,并已在網(wǎng)絡輿情分析中得到了一些應用。相關應用能夠幫助管理者快速理解海量文本中涉及的討論主題,從而把握公眾關切重點,形成有效決策。在主題提取的基礎上,近年來相關研究者陸續(xù)將研究重點轉(zhuǎn)向?qū)φZ義中情感表達的分析,也取得了一定進展。情感分析有助于管理者判斷不同主題下公眾態(tài)度的烈度和極性,有利于進一步科學量化公眾關切。
 
  在社會網(wǎng)絡分析方面,盡管公共管理研究者和實踐者很早即認同社會的網(wǎng)群關系,但近年來社會網(wǎng)絡分析在大規(guī)模計算和工具化、可視化方面的進展才逐漸奠定了其在公共管理與公共政策分析領域的應用基礎。社會網(wǎng)絡分析相關方法主要針對社會科學里對社會結(jié)構(gòu)和社會關系的研究需求,其源頭可追溯到數(shù)學家Euler的圖論工作,其基本思路是以結(jié)點和結(jié)點間聯(lián)系分別代表行動者與行動者關系,在此框架下測度與分析各行動主體間由于資源、信息的流動形成的動態(tài)關系,引入小世界(The Small World)、結(jié)構(gòu)洞(Structural Holes)等理論后使社會網(wǎng)絡分析有能力描述和解釋更為復雜的社會現(xiàn)象和問題。目前,社會網(wǎng)絡分析由于其結(jié)論可視化強等方面的優(yōu)勢在文獻關系及網(wǎng)絡輿情分析中得到了廣泛的應用,社會網(wǎng)絡分析與文本挖掘的疊加有助于發(fā)現(xiàn)公眾關切的集聚與擴散規(guī)律,從而更準確地判斷政府決策與網(wǎng)絡輿情間的互動關系。
 
  在社會計算與多智能體仿真方面,大數(shù)據(jù)同樣為傳統(tǒng)的建模、仿真領域帶來新的生機。王飛躍等人在融合多種建模、仿真方法進展后提出了社會計算(Social Computing)的概念,其中涉及的若干方法通常被認為有助于更好的研究社會選擇。近年來的社會選擇研究主要集中在兩個方面:引入人工智能領域的概念和方法解決社會選擇問題,而反之另一條思路則是將社會選擇理論引入人工智能領域,其中多智能協(xié)商的相關研究屬于兩種思路的融合。在公共管理與公共政策領域,互動的行為體、結(jié)構(gòu)、過程出現(xiàn)不可控的混亂。通過社會選擇模擬輔助研究,界定范圍來限制模型中政策議題的復雜度顯得尤為重要。多智能體仿真可以模擬凸顯性、不確定性、多態(tài)均衡和非現(xiàn)象條件下的對多利益群體、多階層在復雜政策環(huán)境下的行為反應,從而實現(xiàn)對政策效果的評估,該方法已經(jīng)在模擬和評估聯(lián)合國決策方面得到初步應用。與其他大數(shù)據(jù)分析方法的有機結(jié)合可望賦予多智能體仿真更廣闊的發(fā)展空間。
 
  結(jié)合上述大數(shù)據(jù)分析方法的進展,面向公共衍生大數(shù)據(jù)的分析需求將進一步推動研究方法論的整合與創(chuàng)新。通過大數(shù)據(jù)分析方法的引入,公共政策分析相關學科有望突破原有邊界,應對更為復雜的科學問題。將數(shù)據(jù)挖掘、社會計算與傳統(tǒng)公共政策過程中經(jīng)濟學、社會學方法融合,將極大地豐富相關領域研究方法論,從而更好地應對不斷發(fā)展和變化的復雜公共政策問題。這是大數(shù)據(jù)分析可能為公共政策分析領域帶來的貢獻。
 
  三、信息時代政府決策過程的嬗變
 
  隨著上述研究方法的日益發(fā)展,在大數(shù)據(jù)熱潮之初,甚至更早的時間,我們已經(jīng)能夠見到圍繞某一公共話題的數(shù)據(jù)分析研究,如用數(shù)據(jù)表征公共衛(wèi)生、公共交通以及非傳統(tǒng)安全較量中的若干實例。上述工作開拓了研究視野,但更多體現(xiàn)的是特定數(shù)據(jù)分析方法在特殊場合的應用,尚未觸及公共管理與公共政策過程的本質(zhì),所得結(jié)論也多為現(xiàn)象描述,僅能視為公共衍生大數(shù)據(jù)分析的起步。在公共政策過程嬗變的過程中,信息技術(shù)演進的影響從未被研究者忽視,這既包括技術(shù)環(huán)境的直接影響,和技術(shù)環(huán)境通過對公眾觀念帶來轉(zhuǎn)變引發(fā)的間接影響。
 
  從政府決策相關理論的視角來看,公共政策過程是政策問題從議程設置、實施到評估反饋和修正等一系列政策循環(huán)周期的總和。國內(nèi)外學者對其進行了大量的研究,其視角包括強調(diào)權(quán)利結(jié)構(gòu)下的利益博弈,強調(diào)公共目標的理性學習及強調(diào)社會理念作用等。其中應用最為廣泛的是多源流理論和觸發(fā)機制理論。中國的公共政策議程有其內(nèi)在的特點,基于多種理論視角與觀點的融合。王紹光在分析了中國公共政策議程設置的六種模式后,也指出在當今的議程設置過程中,精英專家、傳媒、利益相關群體和人民大眾發(fā)揮的影響力越來越大。推廣到政府的決策模式,鄢一龍等人提出“十五”以來決策過程的集思廣益模式,體現(xiàn)在普通公眾參與日益增多,決策過程日益開放。而網(wǎng)絡的興起與普及應用無疑加劇了這一趨勢。國內(nèi)外均有學者指出了信息時代的諸多特點將對公共政策過程和政府決策過程帶來影響。相關研究主要體現(xiàn)在初步定性分析了網(wǎng)絡輿情熱點及網(wǎng)民政策態(tài)度的形成過程; 在政策議程設置環(huán)節(jié),嘗試探索信息時代政府、媒介和公眾三者關系的變化;部分學者結(jié)合案例試圖描述網(wǎng)絡影響政府決策的過程。然而上述研究考慮網(wǎng)絡能技術(shù)環(huán)境影響時仍主要采取事件觸發(fā)的視角;由于方法論所限也尚未涉及對網(wǎng)絡公眾表達大數(shù)據(jù)進行真正分析和利用的問題。
 
  一方面大數(shù)據(jù)帶來的沖擊會加劇信息時代對政府決策過程的影響,另一方面,政府能否完善決策過程以適應時代和利用大數(shù)據(jù)帶來的機遇也決定了影響的正負的極性。基于多源流理論等經(jīng)典框架來分析和解構(gòu)大數(shù)據(jù)帶來的影響有助于我們在相關理論基礎上探索政府決策過程的重構(gòu)策略和數(shù)據(jù)驅(qū)動機制。這也是公共政策研究可能反作用于大數(shù)據(jù)發(fā)展的貢獻。
 
  四、政策信息學:融合與演進
 
  在大數(shù)據(jù)與政策科學兩方面理論、方法的進展的基礎上,不難發(fā)現(xiàn)在二者交匯的研究領域仍存在真空地帶,許多關鍵科學問題亟待解決,包括:如何整合現(xiàn)有數(shù)據(jù)挖掘方法,實現(xiàn)更好的分析公共衍生大數(shù)據(jù)的目的?從公共衍生大數(shù)據(jù)中獲取的知識如何影響政府決策,需要何種模式與過程的改進?如何基于公共衍生大數(shù)據(jù)評估政府決策過程與決策本身的效果,尤其是前瞻性預測關鍵決策的中長期效果?回答這些問題,可能需要有面向公共衍生大數(shù)據(jù)分析與政府決策過程重構(gòu)的新學科出現(xiàn)。
 
  國際學者已開展探索中引人注意的是美國亞利桑那州立大學提出了政策信息學研究方向。政策信息學可以看作一個以面向如何利用公共政策相關海量信息,更好地理解和解決復雜的公共政策和管理問題,從而實現(xiàn)治理流程和制度創(chuàng)新為目標的若干跨學科研究組成的嶄新領域。因為有可能為政策制定者與利益相關者提供前所未有的知識和決策依據(jù),政策信息學有可能成為未來公共政策過程分析的一個重要學科基礎。目前,相關學者以開展了若干政策信息學研究工作,例如Kim等學者利用空間分析方法來監(jiān)測公共產(chǎn)品欺詐,并用類似的方法研究了俄亥俄州的醫(yī)療補助支出變化的案例。貝葉斯模型也被用于分析公共環(huán)境政策問題。2015年,國際公共政策分析領域的頂級期刊Journal of Policy Analysis and Management(JPAM)集中發(fā)表了三篇在政策信息學方向上的最新探索,即包括利用大數(shù)據(jù)分析和仿真建模方法對教育、醫(yī)療領域政策的研究,也包括如何利用社交網(wǎng)絡優(yōu)化政策過程的探索。
 
  當然,政策信息學僅是一個剛剛勾勒出框架的新方向,針對其重方法輕理論、重描述輕分析、重制定過程輕評估過程等現(xiàn)狀和不足,筆者認為其未來亟待研究的科學問題主要分為以下四類:
 
  公共衍生大數(shù)據(jù)的基礎分析方法研究。公共衍生大數(shù)據(jù)的復雜特性要求相關分析必須在現(xiàn)有分析方法基礎上進行創(chuàng)新與整合。此類研究目標即以政府處理公共事務時面對的多來源、不同結(jié)構(gòu)化程度的網(wǎng)絡輿情、政策文本及系統(tǒng)生成數(shù)據(jù)為主要對象,探索對其具有較好分析與解釋效果的文本挖掘方法與多方法、工具組合,為后續(xù)研究中特定政策議題的分析挖掘、決策效果模擬與評估中的關鍵指標計算奠定方法基礎。其中主要研究問題可能包括探索以關鍵主題提取與多維度情感分析為重點的海量文本數(shù)據(jù)挖掘方法、探索與相關開源分析算法或工具的對接與整合技術(shù)、探索與傳統(tǒng)定性研究方法的整合技術(shù)等。
 
  圍繞特定政策場景的知識發(fā)現(xiàn)研究。從公共衍生大數(shù)據(jù)中發(fā)現(xiàn)對政府決策真正有價值的關鍵知識是政策信息學試圖探索的核心。此類研究目標即通過對多來源數(shù)據(jù)的綜合分析,圍繞特定的公共管理與公共政策問題,尋找那些對公共管理者至關重要的知識,從而揭示由大數(shù)據(jù)分析驅(qū)動政府決策優(yōu)化的可行路徑。其中主要研究問題可能包括針對公共政策過程分析各環(huán)節(jié)相關的公眾態(tài)度與趨勢變化、針對政府日常管理決策與突發(fā)事件應急處置等場景分析公眾輿論熱點與決策反饋等。
 
  面向大數(shù)據(jù)的政府決策模式與決策過程重構(gòu)策略研究。大數(shù)據(jù)時代賦予公共管理者的機遇與挑戰(zhàn)不僅來自特定案例中的挖掘出的管理知識,而更將催生管理模式和決策過程的深刻變革。此類研究目標即基于前述模塊圍繞公共衍生大數(shù)據(jù)的研究發(fā)現(xiàn),結(jié)合公共政策過程與公共管理行為的研究積累,探索并重構(gòu)政府決策過程,提出有效的重構(gòu)策略并重點探討若干重要問題。其中主要研究問題可能包括探索公共衍生大數(shù)據(jù)分析對公共政策過程各環(huán)節(jié)的影響以及相應的重構(gòu)策略、探索公共衍生大數(shù)據(jù)分析中發(fā)現(xiàn)的輿情熱點進入政府決策流程的模式及處置機制等。
 
  公共選擇模擬與決策效果評估研究。政府決策與公共衍生大數(shù)據(jù)分析的深度融合需要經(jīng)歷復雜的互動過程,此類研究的目標在于探索這樣的互動模式,即通過基于多智能體仿真等社會計算基礎方法嘗試進行公共重大議題共選擇模擬及中決策效果的中長期評估,據(jù)此將數(shù)據(jù)分析驅(qū)動決策的過程模塊化和工具化,切實提升政府決策過程的科學性。其中主要研究問題可能將圍繞探索大數(shù)據(jù)驅(qū)動的多智能體群決策仿真與公共選擇模擬,并形成若干基于公共衍生大數(shù)據(jù)計算的決策評估指標并探索期應用機制展開。
 
  在政策信息學框架下四類研究問題密切相關,彼此分割,中間包含著三個有機結(jié)合的研究循環(huán):
 
  圍繞技術(shù)方法與應用場景的第一研究循環(huán)。在正向維度,方法研究服務于特定場景下的知識發(fā)現(xiàn);在逆向維度,根據(jù)公共政策與政府決策特定應用場景下產(chǎn)生的更為聚焦的分析需求又能推動分析方法的改進。在循環(huán)互動中才可能逐漸凝練具有普遍適用性的大數(shù)據(jù)分析方法集。
 
  圍繞知識發(fā)現(xiàn)與重構(gòu)策略的第二研究循環(huán)。在正向維度,基于第一循環(huán)的分析結(jié)果將被總結(jié)提煉為與政策相關的輿情規(guī)律;在逆向維度,根據(jù)政府部門多渠道獲取的公眾反饋將校正決策過程策略。在循環(huán)互動中才可能逐漸探索出大數(shù)據(jù)知識作用與政府決策過程的長效機制。
 
  圍繞機制設計與效果評估的第三研究循環(huán)。在前兩重循環(huán)的基礎上,引入行動研究(ActionResearch)的思維范式,在正向維度,設置觀測大數(shù)據(jù)知識為特定政府部門采納后的決策效果指標;在逆向維度,根據(jù)一些政策可能面臨的階段性反彈,以實際政策效果數(shù)據(jù)為基點模擬公眾選擇變化,從而修正政府決策,進而構(gòu)建分析→決策→評估→再決策的迭代機制。
 
  五、結(jié)語
 
  大數(shù)據(jù)浪潮給公共管理與公共政策分析研究領域帶來全新的機遇和挑戰(zhàn)。通過對大數(shù)據(jù)分析方法的探索、修正及擴展;圍繞特定公共議題相關的公共衍生大數(shù)據(jù)展開分析,從分析結(jié)果中提煉關鍵知識規(guī)律;重構(gòu)政府決策范式與過程;并探索與之相配套的政策過程評估方法與社會選擇模擬方法。這一系列研究挑戰(zhàn)構(gòu)成了面向公共衍生大數(shù)據(jù)分析和政府決策過程重構(gòu)的嶄新領域——政策信息學。在在方法論層面,方法融合與學科交叉是未來科學研究的總體趨勢,相關研究進行的方法論探索對基于大數(shù)據(jù)豐富公共管理與公共政策研究的范式具有前瞻意義;在實踐層面:面對政府與社會共同關注的諸多實際公共問題,嘗試各種分析方法、設計的過程機制、構(gòu)建的評估體系均為實際影響和應用效果導向,可望對切實提升當前政府決策過程的科學性和有效性有所裨益。
 
  本文從對公共衍生大數(shù)據(jù)概念界定入手,通過梳理公共衍生大數(shù)據(jù)分析方法發(fā)展和信息時代政府決策過程嬗變兩方面研究視域下的理論演進,初步探討了公共衍生大數(shù)據(jù)分析與政府決策過程重構(gòu)所面臨的主要科學問題及宏觀研究思路。以期拋磚引玉,對致力和關注相關問題的研究者與實踐者有所借鑒。
 
  作者:張楠,清華大學公共管理學院副教授、電子政務實驗室副主任
責任編輯:admin