導(dǎo)讀
它山之石,可以攻玉。為了幫助各界人士學(xué)習(xí)國(guó)外先進(jìn)經(jīng)驗(yàn),進(jìn)一步了解大數(shù)據(jù)市場(chǎng)的定價(jià)、交易與保護(hù),國(guó)脈戰(zhàn)略研究院專家楊冰之、林渠,帶來(lái)了《大數(shù)據(jù)市場(chǎng)調(diào)查:定價(jià)、交易與保護(hù)》的翻譯文章,相信會(huì)給大家以思想的碰撞、靈感的啟迪,促進(jìn)大家思考,從而為我國(guó)推進(jìn)數(shù)據(jù)要素市場(chǎng)化配置改革,貢獻(xiàn)國(guó)脈戰(zhàn)略研究院的智慧。本文為《大數(shù)據(jù)市場(chǎng)調(diào)查:定價(jià)、交易與保護(hù)》連載系列文章第六篇,也是最后一篇。
隨著傳統(tǒng)媒體日益數(shù)字化,內(nèi)容越來(lái)越多地存儲(chǔ)在數(shù)字卷中,而不是傳統(tǒng)內(nèi)容(電影、報(bào)紙、設(shè)計(jì)圖紙、客戶信息、辦公室文檔等)。換言之,商品正在從實(shí)用物品轉(zhuǎn)變?yōu)樘摂M物品。這樣,內(nèi)容很容易分發(fā)和復(fù)制。因此,數(shù)據(jù)保護(hù)成為確保數(shù)據(jù)所有權(quán)的關(guān)鍵條款。數(shù)據(jù)定價(jià)、數(shù)據(jù)交易和數(shù)據(jù)保護(hù)構(gòu)成了一個(gè)相互影響的三維閉環(huán)。為了實(shí)現(xiàn)數(shù)據(jù)所有者的最大利潤(rùn)和數(shù)據(jù)的最大價(jià)值,數(shù)據(jù)保護(hù)是不可分割的一部分。下面,我們將討論大數(shù)據(jù)生命周期的最后一個(gè)重要階段,即數(shù)據(jù)保護(hù)。
A.數(shù)字版權(quán)管理
建立數(shù)字版權(quán)管理(DRM)是為了防止數(shù)字內(nèi)容被故意復(fù)制、共享和竊取,更重要的是作為數(shù)字版權(quán)保護(hù)發(fā)展的指導(dǎo)方針。2001年初,W3C成立了第一個(gè)DRM集團(tuán),作為參與全球數(shù)字版權(quán)管理的標(biāo)準(zhǔn)組織。實(shí)現(xiàn)DRM的解決方案多種多樣,包括XrML版權(quán)表達(dá)語(yǔ)言、Microsoft DRM、Apple HLS DRM、Adobe Flash access DRM、RealNetworks Helix DRM和OMA DRM規(guī)范。
所有這些DRM解決方案都需要五個(gè)關(guān)鍵組件:(i)安全性。它著重于內(nèi)容的加密以及為數(shù)字內(nèi)容創(chuàng)建哈希、水印和數(shù)字簽名;(ii)訪問(wèn)控制。它負(fù)責(zé)身份和訪問(wèn)管理,并為需要訪問(wèn)受保護(hù)數(shù)字內(nèi)容的用戶提供憑據(jù)。此外,該組件監(jiān)視授權(quán)用戶的行為,并為不同用戶設(shè)置不同的訪問(wèn)權(quán)限;(iii)使用控制。它監(jiān)視每個(gè)授權(quán)用戶的使用情況,并將使用情況記錄為歷史記錄;(iv)許可證管理。它向授權(quán)用戶發(fā)布許可證(密鑰、XrML文件、身份驗(yàn)證代碼),并控制和檢查許可證的生命周期(有效期);(v) 付款管理。此組件與使用控制一起工作,并計(jì)算用戶需要支付的費(fèi)用。這是數(shù)字商務(wù)的主要目標(biāo)。
我們以Microsoft DRM為例來(lái)解釋DRM的工作原理。如圖7所示,匿名用戶嘗試訪問(wèn)內(nèi)容服務(wù)器(content server)以播放或下載某些內(nèi)容,這些內(nèi)容受DRM服務(wù)器保護(hù)。他或她首先向個(gè)性化服務(wù)器發(fā)送請(qǐng)求。然后服務(wù)器檢查個(gè)性化客戶端設(shè)備上的應(yīng)用程序。如果有應(yīng)用程序正在運(yùn)行,應(yīng)用程序?qū)⑾駾RM服務(wù)器發(fā)送許可證要求。個(gè)性化應(yīng)用程序是一個(gè)客戶端DRM軟件,稱為個(gè)性化黑盒(IBX)。如果沒(méi)有此軟件,DRM服務(wù)器將無(wú)法釋放解密內(nèi)容的許可證。為了滿足IBX的要求,DRM服務(wù)器釋放加密的許可證。當(dāng)用戶試圖解密許可證時(shí),IBX保護(hù)敏感信息,這種過(guò)程稱為個(gè)性化。釋放許可證后,DRM服務(wù)器將檢查用戶狀態(tài)。如果這是第一次訪問(wèn)服務(wù)器,DRM將要求用戶加入域。不同的域區(qū)分特定用戶的內(nèi)容和權(quán)限。這就是DRM實(shí)現(xiàn)訪問(wèn)控制的方式。最后,允許用戶訪問(wèn)內(nèi)容服務(wù)器(content server),內(nèi)容服務(wù)器會(huì)發(fā)回內(nèi)容。
?。▓D7. Microsoft數(shù)字版權(quán)管理工作流)
B. 數(shù)字版權(quán)管理模型
根據(jù)不同的數(shù)字內(nèi)容,我們將DRM模型分為以下三類:(i)基于軟件的DRM,(ii)基于多媒體的DRM,以及(iii)基于非結(jié)構(gòu)化數(shù)據(jù)的DRM。
1) 基于軟件的數(shù)字版權(quán)管理
最常見(jiàn)的DRM是基于軟件的DRM,因?yàn)檐浖怯?jì)算機(jī)上使用最廣泛的應(yīng)用程序。軟件屬于數(shù)字商品,易于復(fù)制和重新制作,成本為零。因此,軟件開(kāi)發(fā)公司通常設(shè)計(jì)保護(hù)版權(quán)和防止盜版入侵的機(jī)制。最佳的DRM機(jī)制可以記錄安裝時(shí)間和PC標(biāo)識(shí)信息,并支持多個(gè)安裝和主機(jī)。
涉及的主要方法有兩種:在線身份驗(yàn)證和離線身份驗(yàn)證。對(duì)于在線身份驗(yàn)證,當(dāng)用戶開(kāi)始安裝過(guò)程時(shí),軟件首先檢查Internet連接。如果存在Internet連接,軟件將向DRM服務(wù)器發(fā)送身份驗(yàn)證請(qǐng)求,如上面討論的常見(jiàn)DRM策略中所述。否則,安裝將在沒(méi)有Internet連接時(shí)停止,或者只安裝SoftwareDemo。脫機(jī)身份驗(yàn)證比聯(lián)機(jī)身份驗(yàn)證更重要。如果不支持脫機(jī)DRM,本地許可證文件將很弱,并且很容易解密。許多研究工作集中于離線身份驗(yàn)證。例如,Reavis Conner和Rumelt提出了一個(gè)成本函數(shù)來(lái)衡量解密的復(fù)雜性。如果解密成本大于此函數(shù)確定的價(jià)格,則軟件是安全的。Barapatre等人提出了一種結(jié)構(gòu),以增加解密許可證文件的復(fù)雜性。該模型使用靜態(tài)和動(dòng)態(tài)代碼的代碼注入和軟件版權(quán)保護(hù)(SCP)技術(shù)對(duì)許可證文件進(jìn)行加密,以保護(hù)原始軟件。在軟件層和許可證層(許可證文件、硬件令牌管理文件、庫(kù)文件等)之間引入了保護(hù)動(dòng)態(tài)鏈接庫(kù)(DLL)層。因此,用戶不能直接訪問(wèn)認(rèn)證信息。
2) 基于多媒體的數(shù)字版權(quán)管理
多媒體是數(shù)字商品最重要的組成部分。超過(guò)80%的互聯(lián)網(wǎng)流量專用于視頻內(nèi)容。因此,帶來(lái)的巨大的挑戰(zhàn)是如何妥善保護(hù)多媒體內(nèi)容的版權(quán)。一般來(lái)說(shuō),加密和水印技術(shù)就是在這個(gè)方向上使用的。軟件和多媒體(視頻和音頻)的最大區(qū)別在于在線流媒體。在線視頻和音頻支持實(shí)時(shí)協(xié)議(RTP)/實(shí)時(shí)流協(xié)議(RTSP),以實(shí)現(xiàn)在線流,并且在某些情況下,需要支持組域身份驗(yàn)證(家庭成員、企業(yè)用戶等)。通常,對(duì)手會(huì)在主機(jī)上運(yùn)行惡意客戶端來(lái)中斷和監(jiān)視流,以分析加密密鑰。為了解決這個(gè)問(wèn)題,大衛(wèi)(David)和扎登伯格(Zaidenberg)提出了一種使用選擇性視頻解密的方案,以確保內(nèi)容的安全性,同時(shí)減少加密時(shí)間。此外,選擇性解密是高效視頻加密的一種變體,并且所提出的算法僅對(duì)變換參數(shù)的符號(hào)位進(jìn)行操作。它不需要額外的空間,并且由該算法加密的流產(chǎn)生H.264比特流。同時(shí),該方案通過(guò)限制訪問(wèn)狀態(tài)將加密過(guò)程推進(jìn)到一個(gè)安全的環(huán)境中。例如,用戶要么處于加密狀態(tài),要么處于解密狀態(tài),但不能同時(shí)處于兩種狀態(tài),這是禁止的。
此外,水印技術(shù)已廣泛應(yīng)用于視頻和音頻DRM中。將水印嵌入視頻內(nèi)容需要對(duì)視頻內(nèi)容進(jìn)行完全解碼。這是一個(gè)關(guān)鍵問(wèn)題,因?yàn)檫@一過(guò)程需要大量計(jì)算資源,并降低了視頻質(zhì)量。為了避免隨著視頻比特率的增加而增加嵌入水印的復(fù)雜性,提出了一種基于H.264編解碼器標(biāo)準(zhǔn)的盲水印算法。請(qǐng)注意,H.264是基于運(yùn)動(dòng)補(bǔ)償?shù)母哔|(zhì)量編解碼器標(biāo)準(zhǔn)。H.264標(biāo)準(zhǔn)使用幾個(gè)宏塊以及每個(gè)宏塊的亮度和色度(Cb和Cr)來(lái)表示幀,。水印算法掃描宏塊并選擇最優(yōu)預(yù)測(cè)模型。因此,根據(jù)H.264的特點(diǎn),盲水印算法將水印權(quán)利嵌入到所選宏塊中,防止共謀攻擊,并在解碼過(guò)程中保持視頻質(zhì)量。
有研究提出了另一種水印算法,該算法適用于基于深度圖像渲染(DIBR)的三維視頻內(nèi)容。傳統(tǒng)的水印系統(tǒng)要么會(huì)破壞三維視頻,造成不可逆的變形,要么容易受到攻擊,而本文提出的綜合Duns水印算法克服了這些問(wèn)題。所設(shè)計(jì)的算法基于偽三維離散余弦變換(3D-DCT)和量化索引調(diào)制(QIM)將水印嵌入深度圖中,提高了水印的魯棒性,避免了對(duì)視頻內(nèi)容的破壞。值得注意的是,圖像也被視為多媒體內(nèi)容,類似于視頻和音頻內(nèi)容,水印技術(shù)是保護(hù)版權(quán)的最常用方法。對(duì)于基于圖像的水印系統(tǒng),通常使用離散小波變換(DWT)、最小有效位(LSB)和離散余弦變換(DCT)算法將水印嵌入到安全密鑰中。此外,可以在一幅圖像中嵌入多個(gè)水印。此外,水印方案已被用于追蹤匿名互聯(lián)網(wǎng)惡意流量,以識(shí)別惡意來(lái)源,用于取證。
3) 基于非結(jié)構(gòu)化數(shù)據(jù)的數(shù)字版權(quán)管理
非結(jié)構(gòu)化數(shù)據(jù),如Microsoft Word文檔、PDF文檔、各種數(shù)據(jù)庫(kù)、源代碼等,都是可以方便地傳播和存儲(chǔ)的數(shù)字化數(shù)據(jù)。盡管如此,它是脆弱的,并且很難防止故意復(fù)制和篡改非結(jié)構(gòu)化數(shù)據(jù)。此外,非結(jié)構(gòu)化數(shù)據(jù)通常具有很高的商業(yè)價(jià)值,并且包含敏感信息,這些信息的泄漏將導(dǎo)致數(shù)據(jù)所有者的嚴(yán)重?fù)p失。因此,非結(jié)構(gòu)化數(shù)據(jù)保護(hù)是當(dāng)今的一個(gè)熱門話題,也稱為數(shù)據(jù)泄漏保護(hù)(DLP)。非結(jié)構(gòu)化數(shù)據(jù)DRM與其他類型的DRM完全不同,因?yàn)閿?shù)據(jù)易于操作和損壞。因此,加密作為一種最安全的方法,通常用于保護(hù)非結(jié)構(gòu)化數(shù)據(jù)。盡管如此,隨著數(shù)據(jù)規(guī)模的不斷擴(kuò)大,加密過(guò)程的成本將繼續(xù)增加。例如,史(Shi)等人提出了一種基于概率數(shù)據(jù)結(jié)構(gòu)(Bloom Filter)的保護(hù)方案。該方案將狀態(tài)記錄到帶有正標(biāo)記或?qū)傥粯?biāo)記的矩陣Bloom過(guò)濾器中。該方案包括一個(gè)分析器,用于分析和掃描內(nèi)容。與加密方案相比,該方案具有更好的性能。
總之,在本章節(jié),我們闡述了三種數(shù)字版權(quán)管理模式,并討論了每種模式的現(xiàn)有相關(guān)方法。不同類型的數(shù)字內(nèi)容管理,即基于軟件的數(shù)字版權(quán)管理、基于多媒體的數(shù)字版權(quán)管理和基于非結(jié)構(gòu)化數(shù)據(jù)的數(shù)字版權(quán)管理,已經(jīng)有了很好的探索??梢钥吹剑瑪?shù)字管理技術(shù)是保護(hù)大數(shù)據(jù)不被竊取和復(fù)制的關(guān)鍵方法。盡管如此,隨著數(shù)字內(nèi)容的快速增長(zhǎng)和大數(shù)據(jù)的交易屬性,現(xiàn)有數(shù)據(jù)保護(hù)方案和更先進(jìn)技術(shù)的可行性有待進(jìn)一步研究。
七、 結(jié)論
本文討論了大數(shù)據(jù)交易的問(wèn)題。具體而言,我們首先講述了與大數(shù)據(jù)相關(guān)的現(xiàn)有研究,并確定了數(shù)據(jù)交易的大數(shù)據(jù)生命周期,包括數(shù)據(jù)收集、數(shù)據(jù)分析、數(shù)據(jù)定價(jià)、數(shù)據(jù)交易和數(shù)據(jù)保護(hù)。然后,講述了與大數(shù)據(jù)定價(jià)相關(guān)的現(xiàn)有工作。關(guān)于數(shù)據(jù)定價(jià),闡明了它的重要性,對(duì)不同的市場(chǎng)結(jié)構(gòu)、數(shù)據(jù)定價(jià)策略和數(shù)據(jù)定價(jià)模型進(jìn)行了分類,然后列出了每種類型的優(yōu)勢(shì)和局限性。對(duì)于數(shù)據(jù)交易流程,我們概述了與數(shù)據(jù)交易相關(guān)的關(guān)鍵問(wèn)題及其可能的解決方案。我們進(jìn)一步研究了拍賣策略,詳細(xì)說(shuō)明了不同的方案、交易平臺(tái)和相關(guān)問(wèn)題。最后,研究了作為大數(shù)據(jù)生命周期最后階段的數(shù)據(jù)保護(hù)。對(duì)現(xiàn)有版權(quán)保護(hù)方案進(jìn)行了分類,并概述了大數(shù)據(jù)版權(quán)保護(hù)面臨的挑戰(zhàn)。本次調(diào)查的主要目的是對(duì)大數(shù)據(jù)交易有一個(gè)清晰而深入的了解。我們概述了與數(shù)據(jù)定價(jià)、數(shù)據(jù)交易和數(shù)據(jù)保護(hù)相關(guān)的廣泛主題,并強(qiáng)調(diào)了尚未解決的領(lǐng)域,以進(jìn)一步促進(jìn)大數(shù)據(jù)的研究和開(kāi)發(fā)。
更多精彩,請(qǐng)關(guān)注“官方微信”
國(guó)脈,是大數(shù)據(jù)治理、數(shù)字政府、營(yíng)商環(huán)境、數(shù)字經(jīng)濟(jì)、政務(wù)服務(wù)專業(yè)提供商。創(chuàng)新提出"軟件+咨詢+數(shù)據(jù)+平臺(tái)+創(chuàng)新業(yè)務(wù)"五位一體服務(wù)模型,擁有超能城市APP、營(yíng)商環(huán)境流程再造系統(tǒng)、營(yíng)商環(huán)境督查與考核評(píng)估系統(tǒng)、政策智能服務(wù)系統(tǒng)、數(shù)據(jù)基因、數(shù)據(jù)母體等幾十項(xiàng)軟件產(chǎn)品,長(zhǎng)期為中國(guó)智慧城市、智慧政府和智慧企業(yè)提供專業(yè)咨詢規(guī)劃和數(shù)據(jù)服務(wù),廣泛服務(wù)于發(fā)改委、營(yíng)商環(huán)境局、考核辦、大數(shù)據(jù)局、行政審批局等政府客戶、中央企業(yè)和高等院校。