隨著互聯(lián)網(wǎng)和信息技術的不斷發(fā)展,人類已經(jīng)進入大數(shù)據(jù)時代。數(shù)據(jù)已成為一個國家基礎型的戰(zhàn)略資源。在信息化浪潮的不斷推動下,政府部門多年來積累了越來越多的與民生、經(jīng)濟息息相關的數(shù)據(jù),如醫(yī)療、交通、社保等,一般稱為“政府大數(shù)據(jù)”。與互聯(lián)網(wǎng)上產(chǎn)生的大數(shù)據(jù)低價值密度不同,政府大數(shù)據(jù)具有高價值密度的特點。如何更好地開放、共享,并利用和挖掘政府大數(shù)據(jù)的價值,是當今研究的熱點問題。在這樣的背景下,對于掌握了大量數(shù)據(jù)的政府部門,無異于掌握了大量的資源或資產(chǎn)。然而政府大數(shù)據(jù)的價值是潛在的,只有結(jié)合一定的應用需求和應用場景,由合適的對象用適當?shù)姆椒右蚤_發(fā)和利用,才能發(fā)揮出來,否則就只能是一筆“沉睡”的資產(chǎn)。因此,政府部門如何盤活和管理這筆數(shù)據(jù)資產(chǎn)就顯得尤為重要,政府大數(shù)據(jù)治理就是要解決這一問題。

  政府大數(shù)據(jù)治理的關鍵

  政府大數(shù)據(jù)治理的目標是發(fā)揮出政府大數(shù)據(jù)的潛在價值。即實現(xiàn)多個部門數(shù)據(jù)的共享、開放和市場化利用。簡單來講就是,政府大數(shù)據(jù)治理的結(jié)果能更好地保證有需求的對象在需要的時間獲得合適的數(shù)據(jù)并在正確的場景下合理地使用。有需求的對象,是指具備創(chuàng)新能力和技術實力的部門、初創(chuàng)企業(yè)甚至個人;在需要的時間,是指有應用需求而數(shù)據(jù)恰好也能發(fā)揮作用的時候,例如具備一定時效性的數(shù)據(jù);而所謂合適的數(shù)據(jù),理論上可以是政府部門掌握的任何數(shù)據(jù);正確的場景,是指對數(shù)據(jù)的開發(fā)應用應利國利民惠經(jīng)濟;合理地使用,是不能違反相關法律法規(guī)。

  以上是在理想的情況下發(fā)生的,實際情況卻是,政府部門常常面臨三個方面的難題。一是安全擔憂,擔心部門的數(shù)據(jù)隱含了國家機密造成泄露,導致不敢共享和開放;二是數(shù)據(jù)本身是部門的命脈,數(shù)據(jù)被拿走意味著核心業(yè)務將丟失,而不愿共享和開放;三是數(shù)據(jù)涉及市民隱私,沒有好的技術手段和能力,不知如何共享和開放。這三個方面的問題都限制了政府大數(shù)據(jù)的開發(fā)和利用。

  如果把政府大數(shù)據(jù)作為一個對象,要讓數(shù)據(jù)真正“活”起來,從一大堆雜亂無章的原始數(shù)據(jù),變成面向市民或用戶的產(chǎn)品及服務,本質(zhì)上來講,就是加強了數(shù)據(jù)的流通,以及增多了對數(shù)據(jù)的各種操作。這些操作包括,訪問、下載、修改、更新、復制及轉(zhuǎn)移、融合、清洗、分析、可視化等等。為了保證政府多個部門、多個系統(tǒng),來源廣泛、種類繁多的數(shù)據(jù)能夠更好地從采集、收集到變成產(chǎn)品或服務,需要政府部門建立一個有效的數(shù)據(jù)治理機制,治理機制涉及的問題包括,有多少個環(huán)節(jié)?誰來參與?由誰授權數(shù)據(jù)的這些操作?誰可以被允許對數(shù)據(jù)進行這些操作?誰對操作的結(jié)果負責?誰來監(jiān)督?等等。這些問題貫穿整個政府大數(shù)據(jù)的全生命周期。

  因此,政府大數(shù)據(jù)治理機制的建立,一方面,需要出臺相應的政策和行政管理手段予以配合;另一方面,政府大數(shù)據(jù)的開發(fā)利用亟需一種足夠安全、可靠的技術來保障數(shù)據(jù)資源、資產(chǎn)的共享、開放、流通和保護。

  區(qū)塊鏈技術應用于政府大數(shù)據(jù)治理

  區(qū)塊鏈是一種去中心化的分布式賬本技術,整個賬本由數(shù)據(jù)區(qū)塊鏈接形成,由所有參與者共同維護,每個參與者都存有一份拷貝,單個參與者對數(shù)據(jù)的修改不起作用。非對稱加密技術確保了數(shù)據(jù)不可篡改。圍繞某項資產(chǎn),每一筆交易或者操作生成一個新區(qū)塊,所有的參與者或見證人由約定的規(guī)則達成共識,進行添加上鏈,從而來記錄和追溯整個過程。由以上特點不難看出,區(qū)塊鏈技術適合應用于去中心化的、多方參與、共同維護以增強信任的應用場景。

  政府大數(shù)據(jù)治理是一個需要多方參與的過程。涉及數(shù)據(jù)的產(chǎn)生者、采集者、管理者、使用者等等。政府大數(shù)據(jù)的開發(fā)利用恰是一個多元主體、多方參與、權限不一、環(huán)節(jié)眾多的應用場景。區(qū)塊鏈的技術特點可以在諸多方面發(fā)揮作用,應用到政府大數(shù)據(jù)的治理中來。如圖1所示。

大數(shù)據(jù)

  首先,區(qū)塊鏈具有可追溯性和不可篡改性,數(shù)據(jù)塊一旦生成就表示得到過所有參與者的認同,無法篡改,且?guī)в袝r間戳。這個好處應用到政府大數(shù)據(jù)治理當中可以幫助數(shù)據(jù)確權(包括原始來源、管理權、訪問權、使用權等),促進數(shù)據(jù)流通,準確記錄數(shù)據(jù)的產(chǎn)生、交換、轉(zhuǎn)移、更新、開發(fā)利用整個過程。把數(shù)據(jù)作為核心命脈,擔心數(shù)據(jù)因為共享或開放出去之后核心業(yè)務就丟失的部門可以因此而消除顧慮。

  其次,在區(qū)塊鏈上,數(shù)據(jù)包的哈希值是唯一的,能驗證數(shù)據(jù)包的真實性。哈希加密算法對數(shù)據(jù)可能涉密或隱私部分進行加密,能在流通環(huán)節(jié)將數(shù)據(jù)進行一定程度的脫敏。同時,在涉及數(shù)據(jù)各方之間采用非對稱加密技術,可以更好地劃分角色,更加精細化對數(shù)據(jù)的操作權限,保障數(shù)據(jù)隱私安全。從而降低政府部門對數(shù)據(jù)的安全隱私擔憂。

  再次,應用區(qū)塊鏈技術,每個區(qū)塊的生成都得到了所有參與者的共識,在區(qū)塊鏈上,數(shù)據(jù)交換記錄是所有參與者認可的、透明的、可追溯的,數(shù)據(jù)的來源和流通路徑是可以被記錄和追溯,對數(shù)據(jù)的每一次更新和修改都“有跡可循”,同時,采用哈希算法可以對數(shù)據(jù)的完整性進行驗證,從而保障和提升了數(shù)據(jù)在流通中的質(zhì)量。

  最后,應用基于區(qū)塊鏈的智能合約技術,可以自動管理和執(zhí)行政府部門之間約定好的數(shù)據(jù)共享開放利用規(guī)則,在實際操作過程中減少人為的干預,營造可信任的數(shù)據(jù)共享開放環(huán)境。

  技術實現(xiàn)與應用局限性探討

  區(qū)塊鏈技術應用于政府大數(shù)據(jù)治理,可以將數(shù)據(jù)所有權、數(shù)據(jù)傳播過程、交易鏈條等相關信息完整全面地記錄在分布的數(shù)據(jù)塊中,并在所有參與方之間達成共識,共同維護。本節(jié)我們舉例探討在實際操作層面,區(qū)塊鏈應用于政府大數(shù)據(jù)治理在技術實現(xiàn)上有哪些需要考慮的問題,以及可能存在哪些局限。區(qū)塊鏈技術應用于政府大數(shù)據(jù)治理,從實操層面,有以下幾個環(huán)節(jié)是必不可少的。

  1.建鏈。區(qū)塊鏈根據(jù)開放程度不同,可分為公有鏈、聯(lián)盟鏈和私有鏈。公有鏈對所有人開放,任何人都可以參與;聯(lián)盟鏈對特定的一些組織開放,私有鏈只對某個組織或個人開放。根據(jù)政府大數(shù)據(jù)的開放程度不同,可以采用不同的區(qū)塊鏈。例如,對于國家級或省市級建的基礎大數(shù)據(jù)中心,可以采用公有鏈,全民所有,全民共享;對于地方政府部門之間共享數(shù)據(jù),可以采用聯(lián)盟鏈;而針對某個部門某種數(shù)據(jù)的管理,可以采用私有鏈?;疽?guī)則:每一類數(shù)據(jù)建一條鏈。數(shù)據(jù)區(qū)塊記錄數(shù)據(jù)來源、所有權,數(shù)據(jù)操作方,當前的時間戳,對數(shù)據(jù)的操作類型,當前版本號,上一區(qū)塊的哈希值等等。對數(shù)據(jù)的任何操作(更新、復制、下載等)→觸發(fā)生成一個區(qū)塊→接入?yún)^(qū)塊鏈。對數(shù)據(jù)進行全生命周期記錄。

  2.共識機制的設計。共識機制的基本要求是多方參與、各司其責、各得其所,從而能夠?qū)?shù)據(jù)的全生命周期進行管理和監(jiān)督。一個好的共識機制還需要帶有激勵機制,以激勵各方積極參與到管理數(shù)據(jù)的活動中來。例如,誰獲得了記錄權,誰就贏得積分,請求使用數(shù)據(jù)則消耗積分。同樣,作為數(shù)據(jù)提供方,分享出的數(shù)據(jù)如被請求和使用了,可獲得積分獎勵。至于誰可以加入鏈,公有鏈不存在這個問題,私有鏈由中心節(jié)點批準,對于聯(lián)盟鏈,可以集體批準接入,或者達到一定比例者同意即可;所有加入的鏈都可以自由退出。

  3.基于智能合約的權限管理和交易規(guī)則?;谥悄芎霞s,數(shù)據(jù)權限管理和交易規(guī)則可通過鏈上編碼實現(xiàn),在交易過程中自動執(zhí)行,不需要人為干涉,實時在線地保證數(shù)據(jù)操作的合法、合理、合規(guī)性。例如:在多個部門共享數(shù)據(jù)模型中,每個部門都通過共享出自己的數(shù)據(jù)(數(shù)據(jù)類型、數(shù)據(jù)量、更新頻率等)獲得積分(具體積分機制需要商定),我們可以簡單地定義為,積分更高就能有更高的權限請求和使用其他部門的數(shù)據(jù),權限值達到了,請求操作的數(shù)據(jù)區(qū)塊便可自動生成,協(xié)議生效,不需要人工干預,從而提升了效率。如圖2所示。

  應用局限性探討。由于政府部門較多,信息化程度不一,導致數(shù)據(jù)類型多樣、標準各異,因此,需要創(chuàng)建的區(qū)塊鏈也必然數(shù)量繁多、多種多樣,從而針對區(qū)塊鏈本身的治理也將會是問題。同時,由于區(qū)塊鏈上的數(shù)據(jù)所有參與方都要存一份拷貝,而某些類型的政府數(shù)據(jù)量太大,沒有辦法完全生成區(qū)塊上鏈,例如視頻監(jiān)控數(shù)據(jù)。這種情況下,從傳輸效率和節(jié)省存儲空間消耗的角度出發(fā),區(qū)塊鏈技術只應用到治理機制層面,對政府大數(shù)據(jù)的治理起到一定的輔助作用。我們可以把這種模式稱為“基于區(qū)塊鏈的輕治理機制”。而把所有數(shù)據(jù)都放到區(qū)塊鏈上的模式稱為“基于區(qū)塊鏈的強治理機制”。

  在當今大數(shù)據(jù)時代,政府大數(shù)據(jù)是一筆寶貴的資產(chǎn),政府大數(shù)據(jù)治理的目的就是要盤活這筆資產(chǎn),挖掘和利用數(shù)據(jù)的潛在價值,取得社會化利用。政府大數(shù)據(jù)治理是一項涉及政策、管理、技術,甚至法律、制度的系統(tǒng)工程。政府部門在推動數(shù)據(jù)共享、開放、市場化利用的過程中面臨不敢共享開放、不愿共享開放、不知如何共享開放等諸多難題。破解這些難題需要一種足夠安全、可靠、靈活的技術來支撐。

  區(qū)塊鏈是一種去中心化、分布式的賬本技術,具有去信任、不可篡改、可追溯等優(yōu)點,非常適合應用于多元主體參與、多個流程和環(huán)節(jié)的治理過程,能夠在政府大數(shù)據(jù)治理過程中重塑機制、改造流程、增強信任、提高效率等。本文探討了區(qū)塊鏈技術應用于政府大數(shù)據(jù)治理的多個方面的優(yōu)勢,以及初探了技術實現(xiàn)上的可能性和局限性。

  (本文刊登于《中國信息安全》雜志2017年第12期)

  中國科學院計算技術研究所 范靈俊 洪學海

責任編輯:qinpeng