11月28-29日,由中國(guó)社會(huì)科學(xué)院信息化研究中心和北京國(guó)脈互聯(lián)信息顧問(wèn)有限公司聯(lián)合舉辦的“2018智慧中國(guó)年會(huì)”在北京隆重召開(kāi),以“數(shù)據(jù)賦能智慧中國(guó)”為主題,共有來(lái)自全國(guó)部委、省、市、區(qū)縣電子政務(wù)、智慧城市、大數(shù)據(jù)主管領(lǐng)導(dǎo)、行業(yè)專(zhuān)家、企業(yè)代表、主流媒體千余人參會(huì)。
本文系DAMAChina專(zhuān)家田景熙于11月29日上午在“2018智慧中國(guó)年會(huì)”分論壇六——“微服務(wù)與數(shù)據(jù)賦能平臺(tái)構(gòu)建與實(shí)踐研討會(huì)”上的演講,內(nèi)容通過(guò)現(xiàn)場(chǎng)速記整理,未經(jīng)本人審核。
【DAMAChina專(zhuān)家田景熙】
大家好,今天圍繞《統(tǒng)一元數(shù)據(jù)標(biāo)準(zhǔn)動(dòng)態(tài)管理解決方案》的主題跟大家做分享,主要講三個(gè)問(wèn)題:
第一、政務(wù)元數(shù)據(jù)管理中的問(wèn)題;
第二、元數(shù)據(jù)標(biāo)準(zhǔn)化管理的需求;
第三、介紹基于DPS/DPM解決方案思路。
關(guān)于元數(shù)據(jù)管理中的問(wèn)題。首先形成共識(shí),一種說(shuō)法元數(shù)據(jù)是定義和描述其他數(shù)據(jù)的數(shù)據(jù);另一種權(quán)威說(shuō)法是信息和文件,數(shù)據(jù)在經(jīng)歷了很長(zhǎng)時(shí)間后,對(duì)用戶仍有可理解性和共享性。
針對(duì)電子政務(wù)數(shù)據(jù)元,我們國(guó)家一個(gè)比較領(lǐng)先的省市做過(guò)一次調(diào)查,此次調(diào)查共計(jì)有30多個(gè)數(shù)據(jù)項(xiàng),120個(gè)機(jī)構(gòu)。調(diào)查發(fā)現(xiàn)在系統(tǒng)中有命名沖突、定義沖突,格式?jīng)_突、分類(lèi)沖突、結(jié)構(gòu)沖突、描述沖突等多個(gè)問(wèn)題,是影響數(shù)據(jù)融合和資源再造以及政府?dāng)?shù)據(jù)價(jià)值提升的大問(wèn)題。
從數(shù)據(jù)治理角度來(lái)看,應(yīng)該從什么地方入手?
1、物理數(shù)據(jù):文件、記錄及格式、視圖、索引、數(shù)據(jù)字典...;
2、邏輯數(shù)據(jù):實(shí)體、屬性、關(guān)系、規(guī)則、業(yè)務(wù)名、定義...;
3、內(nèi)容數(shù)據(jù):語(yǔ)義、語(yǔ)境、語(yǔ)用、語(yǔ)法...;
4、管理數(shù)據(jù):數(shù)據(jù)項(xiàng)、數(shù)據(jù)模型、數(shù)據(jù)使用、數(shù)據(jù)質(zhì)量、變更...;
5、整合數(shù)據(jù):數(shù)據(jù)源/渠/匯、數(shù)據(jù)目錄、數(shù)據(jù)轉(zhuǎn)換、EAI、遷移和變換...;
6、運(yùn)行數(shù)據(jù):數(shù)據(jù)組件、服務(wù)、消息、標(biāo)記、觸發(fā)、進(jìn)程、關(guān)聯(lián)...;
7、業(yè)務(wù)數(shù)據(jù):業(yè)務(wù)定義、業(yè)務(wù)架構(gòu)、業(yè)務(wù)規(guī)則、業(yè)務(wù)分析、業(yè)務(wù)關(guān)聯(lián)、業(yè)務(wù)整合活動(dòng)、角色、作業(yè)、輸入/出、工作流、流程規(guī)則...;
8、元數(shù)據(jù)管理:采集、識(shí)別、分析、標(biāo)準(zhǔn)化處理、組合、注冊(cè)、發(fā)布...;
各行業(yè)標(biāo)準(zhǔn)很多定義是沖突的,原因是從國(guó)際標(biāo)準(zhǔn)、國(guó)家標(biāo)準(zhǔn)上,對(duì)元數(shù)據(jù)標(biāo)準(zhǔn)化的研究非?;靵y。針對(duì)元數(shù)據(jù)注冊(cè)系統(tǒng),建立的邏輯架構(gòu),系統(tǒng)管理進(jìn)行標(biāo)準(zhǔn)化后,對(duì)元數(shù)據(jù)管理系統(tǒng)起到了很大作用。但只是孤立的考慮元數(shù)據(jù)的規(guī)則,并未結(jié)合具體應(yīng)用。
一、元數(shù)據(jù)標(biāo)準(zhǔn)化滯后:以ISO11179為代表
先講兩個(gè)概念,第一,注冊(cè)是指賦與數(shù)據(jù)元明確定義與標(biāo)識(shí),使各方獲得其規(guī)范化的描述;
第二,注冊(cè)系統(tǒng)是指統(tǒng)一存儲(chǔ)、加工與描述數(shù)據(jù)元的信息:注冊(cè)標(biāo)識(shí)符、定義、名稱(chēng)、值域,元數(shù)據(jù)和管理屬性等。這可以為電子政務(wù)提供一個(gè)案例和解決思路。
如今我們遇到問(wèn)題,主要是孤立考慮元數(shù)據(jù)定義的規(guī)范以及其形態(tài)與結(jié)構(gòu)注冊(cè)的標(biāo)準(zhǔn)化,不涉及應(yīng)用,不能解決跨系統(tǒng)資源整合中的各類(lèi)矛盾。后續(xù)會(huì)朝著ISO8000+ISO22745系列(主數(shù)據(jù)標(biāo)準(zhǔn)與開(kāi)放式主數(shù)據(jù)詞典)發(fā)展。
二、問(wèn)題與思路
第一,元數(shù)據(jù)長(zhǎng)期作為附屬資源,是導(dǎo)致許多領(lǐng)域數(shù)據(jù)開(kāi)發(fā)與應(yīng)用無(wú)法深入的主要原因;觀念改進(jìn)上,應(yīng)將其當(dāng)作基礎(chǔ)性、獨(dú)立性、自在性、能動(dòng)性的價(jià)值資源來(lái)重新看待;
第二,元數(shù)據(jù)的單元一、孤立、局部標(biāo)準(zhǔn)化遠(yuǎn)不敷數(shù)據(jù)管理與應(yīng)用的需求;
第三,元數(shù)據(jù)的標(biāo)準(zhǔn)化,應(yīng)面向其作為基礎(chǔ)資源設(shè)施來(lái)設(shè)計(jì)、規(guī)劃、建設(shè)、運(yùn)維與管理;
第四,元數(shù)據(jù)的標(biāo)準(zhǔn)化是分層級(jí)、結(jié)構(gòu)化、過(guò)程性的系統(tǒng)性標(biāo)準(zhǔn)化;
第五,政務(wù)數(shù)據(jù)治理的目標(biāo)是構(gòu)建統(tǒng)一的政務(wù)資源的元數(shù)據(jù)管理體系。
三、元數(shù)據(jù)資源標(biāo)準(zhǔn)化的層次架構(gòu)
層次標(biāo)準(zhǔn)化架構(gòu)符合人類(lèi)語(yǔ)言的演化與發(fā)展:
?。?)數(shù)據(jù)元標(biāo)準(zhǔn)化指的是數(shù)據(jù)元是構(gòu)成信息資源的最小單位,相當(dāng)于語(yǔ)言中的字、詞;
(2)復(fù)合數(shù)據(jù)元標(biāo)準(zhǔn)化指的是由數(shù)據(jù)元組成,相當(dāng)于語(yǔ)言中的詞組、成語(yǔ)等;
?。?)數(shù)據(jù)段標(biāo)準(zhǔn)化指的是中等規(guī)模信息單位,等效于語(yǔ)句;是預(yù)定義的復(fù)合數(shù)據(jù)元的固定搭配與組合。
元數(shù)據(jù)標(biāo)準(zhǔn)化要求有構(gòu)成獨(dú)立的、基礎(chǔ)政務(wù)數(shù)據(jù)資源設(shè)施;與應(yīng)用無(wú)關(guān)以及綜合標(biāo)準(zhǔn)化(包括統(tǒng)一、簡(jiǎn)化、序列化、組合化、集成化)。
通過(guò)以上手段,可以實(shí)現(xiàn)提升數(shù)據(jù)的結(jié)構(gòu)性與重用性;增加資源內(nèi)聚度,降低波動(dòng)效應(yīng)、減小資源共享與交換的難度與成本,提升資源質(zhì)量與管理性。
四、數(shù)據(jù)點(diǎn)空間(DPS)與數(shù)據(jù)點(diǎn)模型(DPM)的基本概念
1.以多維“特征軸”組織元數(shù)據(jù),稱(chēng)數(shù)據(jù)空間(DS)---各特征元數(shù)據(jù)軸具有正交性、序列性、組配性,獨(dú)立建設(shè)維護(hù);
2.任何實(shí)體數(shù)據(jù)在DS中,映射為各軸上的點(diǎn)位,稱(chēng)“數(shù)據(jù)點(diǎn)(DP)”;
3.DP用于數(shù)據(jù)對(duì)象特征描述。選擇DS的各軸,抽取其中各點(diǎn)位(區(qū)段),為“數(shù)據(jù)點(diǎn)模型(DPM)”;
4.DPM可描述:實(shí)體、概念、關(guān)系、業(yè)務(wù)、過(guò)程、規(guī)則……;可按需增減與組配各軸。
五、數(shù)據(jù)點(diǎn)模型(DPM)的意義
第一,數(shù)據(jù)點(diǎn)空間(DPS)以數(shù)學(xué)為工具,為對(duì)象給出元數(shù)據(jù)資源配置集(DP);形態(tài)為文字,坐標(biāo)值,提升資源的可計(jì)算性與安全性;
第二,DPS不尋求直接的語(yǔ)義計(jì)算,而構(gòu)建正交語(yǔ)義軸中的特征集,以及各集合間的轉(zhuǎn)換;
第三,DPS中,實(shí)體數(shù)據(jù)不再僅依靠人工描述,可通過(guò)計(jì)算機(jī)資源點(diǎn)篩選與適配來(lái)組成。計(jì)算機(jī)可逐步掌握在特定業(yè)務(wù)與語(yǔ)境下的元數(shù)據(jù)資源的查詢、供應(yīng)與適配,為從宏觀、中觀到微觀層面的資源描述提供全新途徑;
第四,DPS不再使用單一資源目錄,各語(yǔ)義軸自成目錄體系,N軸組成N(N-1)/2個(gè)“資源面”,再組成“數(shù)據(jù)超方”,通過(guò)軸間的旋轉(zhuǎn)、組配等能自行構(gòu)建規(guī)模宏大的資源體系。
六、DPM的數(shù)據(jù)表示
1、DPM的空間結(jié)構(gòu)
用三元組(X,F(xiàn),T)表示某政務(wù)域
X為論域,為描述元素集合;F為論域的特征需求與元數(shù)據(jù)軸的映射規(guī)則,用函數(shù)F:X→Y表示;
Y是n維語(yǔ)義空間;T為論域的架構(gòu),指其中各元素間的關(guān)聯(lián)/構(gòu)成(語(yǔ)義層)。
則DPM的語(yǔ)義空間結(jié)構(gòu)示意為:
(1)論域X可擴(kuò)充各領(lǐng)域元數(shù)據(jù)軸;
?。?)可按論域內(nèi)的元素關(guān)系對(duì)描述分解與細(xì)化。
2、DPM的時(shí)序結(jié)構(gòu)——對(duì)各語(yǔ)義正交的元數(shù)據(jù)軸,前述函數(shù)F(x)隨業(yè)務(wù)進(jìn)程需要不同的特征數(shù)據(jù)元,其時(shí)序進(jìn)程形態(tài)為F(R)
3、DPM的擴(kuò)展形態(tài)
R為元數(shù)據(jù)需求擴(kuò)展集;如Ri(i=1,2,3…)表示業(yè)務(wù)類(lèi)、流程類(lèi)、操作類(lèi)、管理類(lèi)等元數(shù)據(jù),可動(dòng)態(tài)維護(hù);Rij(i=1,2,3…;j=1,2,3…)表DPS對(duì)各元數(shù)據(jù)軸的點(diǎn)位映射。如:業(yè)務(wù)類(lèi)元數(shù)據(jù)集由“業(yè)務(wù)數(shù)據(jù)定義集、業(yè)務(wù)規(guī)則集、數(shù)據(jù)模型集…”
七、DPM的語(yǔ)義展示
第一,對(duì)象類(lèi)標(biāo)識(shí)—元數(shù)據(jù)對(duì)象的類(lèi)別標(biāo)識(shí),區(qū)分元數(shù)據(jù)對(duì)象集中的不同對(duì)象類(lèi);
第二,關(guān)鍵特征—構(gòu)成元數(shù)據(jù)對(duì)象的核心特征,其集合可唯一區(qū)別元數(shù)據(jù),用于對(duì)元數(shù)據(jù)對(duì)象的檢索;
第三,一般特征—元數(shù)據(jù)對(duì)象的使用特征,結(jié)合論域系統(tǒng)生命周期的描述需求,考慮元數(shù)據(jù)對(duì)象在元數(shù)據(jù)系統(tǒng)運(yùn)行各階段和各種應(yīng)用系統(tǒng)中體現(xiàn)出的使用特征。
注:獲取更多會(huì)議信息及嘉賓演講資料,歡迎登錄“2018智慧中國(guó)年會(huì)官網(wǎng)”。
現(xiàn)場(chǎng)照片直播分享: