中國國家圖書館是綜合性研究圖書館,是國家總書庫和全國圖書館元數(shù)據(jù)中心,它同時履行國立圖書館和公共圖書館的職能,承擔著為中央國家領(lǐng)導(dǎo)機關(guān)、重點科研、教育、生產(chǎn)單位和社會公眾服務(wù)的任務(wù)。2008年5月1日,隨著《政府信息公開條例》的實施,公共圖書館被賦予了“政府信息公開窗口”的職責,而為了更好地滿足公眾需求,國家圖書館與北京拓爾思信息技術(shù)股份有限公司(簡稱TRS)簽署合作協(xié)議,將應(yīng)用TRS產(chǎn)品建設(shè)“國圖政府信息整合發(fā)布平臺”,以構(gòu)建一個方便、快捷的政府公開信息整合服務(wù)門戶,使公眾可以像應(yīng)用Google一樣搜索分布在全國各地政府網(wǎng)站上的政府公開信息,以及國家圖書館收藏的各類政府出版物和學術(shù)文獻。

  國家圖書館作為全國圖書館界國際化和現(xiàn)代化發(fā)展的風向標,它在全國圖書館標準化、規(guī)范化、數(shù)字化、網(wǎng)絡(luò)化建設(shè)中發(fā)揮著骨干作用,為此筆者對國家圖書館數(shù)字資源部主任王志庚進行了獨家專訪,以期望在政府信息公開的新形式下,把國圖在數(shù)字資源建設(shè)方面的豐富經(jīng)驗及先進做法展現(xiàn)給大家,從而推動整個圖書館界在政府公開信息開發(fā)和利用領(lǐng)域的發(fā)展。

  筆者:

  隨著各級政府部門對政府信息公開目錄的建設(shè),政府信息公開資源的開發(fā)利用可能成為今后幾年市場的趨勢,那么國圖對于“政府公開信息整合平臺”這個政府信息公開領(lǐng)域的首個垂直搜索引擎系統(tǒng),有什么預(yù)期的建設(shè)目標和建設(shè)效益?

  王志庚:

  圖書館是搜集信息,整理信息,提供信息服務(wù)的場所,圖書館員要做的事情就是給“書”找人,給人找“書”,而政府信息就是我們搜集的對象之一。

  2008年5月1日《政府信息公開條例》的頒布,對于圖書館來說是一個發(fā)展契機,圖書館成為了政府開放信息的查詢窗口。政府信息公開的行為本身是政府行為,它們有層次、分地域、分不同行業(yè)和部門,同時政府信息公開的格式也各不相同。但政府信息本身是有關(guān)聯(lián)性的,不是孤立的,從中央到地方,到各部門,怎樣引用、摘述、流轉(zhuǎn)、整合這些政府信息公開資源,都需要由我們這樣的專業(yè)機構(gòu)介入。利用成熟的文獻信息管理方法和工具,把政府公開信息納入到圖書館信息整合的流程中來,這樣就能把資源盤活了,因此我們要建設(shè)政府公開信息的整合服務(wù)平臺。政府的義務(wù)是公開,而圖書館的義務(wù)是整合和服務(wù)。按照我們的設(shè)想,國圖整合中央級的政府信息,各省館整合省級和地縣級政府信息,通過國圖的開先河,帶動兄弟圖書館在政府信息整合方面的統(tǒng)籌協(xié)調(diào)發(fā)展。

  另外,從信息長期保留和存檔的角度來看,政府網(wǎng)站上的許多信息需要長期保存,如,我們現(xiàn)在行政體制在改革,很多中央部委不存在了,但曾經(jīng)發(fā)布在那些部委網(wǎng)站上的公開信息,對今后的學者了解近當代中國行政生態(tài)是很重要的參考依據(jù)和文獻素材,所以說,政府網(wǎng)絡(luò)信息需要圖書館去做信息整合和服務(wù)。

  筆者:

  《政府信息公開條例》實施至今,關(guān)于政府信息公開的訴訟案件已有幾十起,如山東某記者要求環(huán)保局把企業(yè)排污指標公布出來,但公布這些信息對于環(huán)保局來說是個大工程,它需要花很大力氣做整理工作,而國家限定只能收取檢索費、復(fù)制費和郵寄費等三項費用,并只收成本價格,如有的地方規(guī)定依申請公開一條信息為3毛錢,因此政府就面臨著此類依申請公開“3毛錢”的尷尬。在這方面我國還處于一個空白階段,而在國外這種非常專業(yè)的服務(wù)卻由第三方做,您怎么看待這個問題?

  王志庚:

  這屬于增值服務(wù)的范疇,在我個人看來,由第三方承接政府信息資源的增值服務(wù)也是中國市場未來的一個趨勢,目前在政府信息資源的增值服務(wù)方面,國家圖書館涉及到兩點:

  政府信息資源的數(shù)字化,十幾年以前的政府信息大多都不是數(shù)字化形式的,這就涉及一個數(shù)字化的問題,如:涉及政府檔案性質(zhì)的東西需要公開,但它們是紙制出版物,為了讓紙制文獻被檢索、發(fā)現(xiàn)和利用,降低整個社會發(fā)現(xiàn)和索取利用的成本,就需要把非數(shù)字化的信息數(shù)字化后放到網(wǎng)上,這也是國圖在做的事情,這是一個增值點。

  另外一個增值點是“泛”政府信息的整合和服務(wù),也就是公開目錄未涉及的相關(guān)內(nèi)容,比如:政府組織的各類會議和公共活動,這些都能衍生出來很多內(nèi)容,可能是孤立的網(wǎng)站、視頻等會議資料,這些就是“泛”政府信息;還有一類是政府官員出席活動的講話,或者政府官員的博客,這些都涉及我國的政治發(fā)展,也需要我們國家政府管理好;另外一類是正式的政府出版物,它們屬于商業(yè)信息資源。

  還有,未來不排除國家圖書館提供“依申請公開窗口”的可能性,當公眾有需要時,通過國圖提出請求,國圖再到相關(guān)部門處找到信息源,并經(jīng)過加工提供給請求者,但國圖作為公共服務(wù)的部門,提供信息是公益服務(wù),如果涉及費用,也只有成本費,不會贏利。

  政府信息公開有自己的目錄和元數(shù)據(jù)標準。國家圖書館有自己的知識組織語言,有分類法,有主題詞表,其中主題詞表是目前國內(nèi)唯一面向海量應(yīng)用的知識組織工具,用這個詞表來整合政府公開信息所產(chǎn)生的增值作用,值得期待。

  筆者:

  從標準的制定來講,目前政府信息公開主要是在網(wǎng)站上進行呈現(xiàn),一旦在網(wǎng)站上呈現(xiàn),它的存儲或元數(shù)據(jù)的提取,就完全是按照網(wǎng)站利用或展現(xiàn)的手法來規(guī)定一些字段或元數(shù)據(jù),但它們沒有圖書館那么深厚的元數(shù)據(jù)描述基礎(chǔ),或不全面和不科學,在標準制定方面雖然國辦制定了標準,但是落實到網(wǎng)站上標準在走形,您怎么看待這個問題?

  王志庚:

  我們也一直在關(guān)注和調(diào)研這個問題,不同政府網(wǎng)站的元數(shù)據(jù)框架差異很大,有些甚至完全為了視覺效果,為了迎合網(wǎng)民瀏覽和閱讀的習慣,迎合用戶的感受和體驗來制定元數(shù)據(jù)標準,但實際上從整合和管理資源的角度講,這種做法不利于信息資源長久的、可持續(xù)的保存和增值利用。

  這種現(xiàn)象的主要原因是信息公開還是初級階段,很多政府特別是基層政府還沒有完全反應(yīng)過來,甚至不知道應(yīng)該怎么做,只知道公開,公開有什么標準、什么步驟、什么程序,沒有什么參考的依據(jù)。同時信息公開資源的開發(fā)利用是一個鏈條,信息源頭不規(guī)范,也就是上游不規(guī)范,帶來了下游整合難度非常大。

  因此,我非常希望相關(guān)管理部門盡早成立一個高層的技術(shù)研究工作組,制定并出臺政府信息加工和發(fā)布的相關(guān)數(shù)據(jù)、平臺和協(xié)議的標準規(guī)范,這一規(guī)范既要適應(yīng)未來互聯(lián)網(wǎng)的技術(shù)發(fā)展需求,同時還要兼顧數(shù)字出版、數(shù)字教育、數(shù)字科研和數(shù)字圖書館等系統(tǒng)既有的元數(shù)據(jù)以及系統(tǒng)互操作方面的標準和規(guī)范。

  筆者:

  國務(wù)院7月份針對各省市信息公開的建設(shè)情況組織了一次調(diào)研,在這期間有關(guān)人士提出檔案館、圖書館以后會不會成為政府信息公開的容災(zāi)備份中心?基于此觀點,您覺得對于電子政務(wù)服務(wù)商來說,2009年圖書館、檔案館會不會在政府信息公開方面做些事情?尤其是地方?

  王志庚:

  我國的新聞出版管理規(guī)定中有一套成熟的出版物繳存制度,對于全國所有的出版社或其他出版機構(gòu),只要出版一本書、一本期刊或一份報紙,就必須向國家圖書館免費提供一定數(shù)量的樣品,國圖具有無償接受繳送的權(quán)利。這也是大多數(shù)發(fā)達國家都在執(zhí)行的國家出版物存檔制度。

  但我國的政府出版物,特別是過去的政府出版物好多是內(nèi)部資料,它沒有明確的繳存制度,所以圖書館特別希望在這次政府信息公開中能夠把公共圖書館,特別是省及以下級圖書館作為當?shù)卣霭嫖锏姆ǘㄊ绽U單位。只有這樣,圖書館才能實現(xiàn)對政府信息的長期備份保存,不管是紙制的出版物繳存,還是光盤,或網(wǎng)絡(luò)形式的政府信息。

  文化館、檔案館、圖書館作為政府信息的法定收繳機構(gòu),或稱容災(zāi)備份基地,國際早有這樣的潮流。另外,現(xiàn)在國際上一個很大的趨勢:“圖文檔合流”,就是圖書館、文化館、檔案館的合并,這三者融合的動因,有些是出于財務(wù)性需要,由于國家經(jīng)費有限所致“記憶機構(gòu)”的體制性合并的現(xiàn)象,主要的誘因是記憶機構(gòu)的功能性融合,這是網(wǎng)絡(luò)環(huán)境下“記憶機構(gòu)”集體實現(xiàn)價值再造的主動性發(fā)展訴求,是現(xiàn)代信息社會共建共享發(fā)展的必然結(jié)果。

  筆者:

  網(wǎng)絡(luò)上有那么多信息,但大家還找不到信息,這就需要用垂直搜索,行業(yè)門戶去細分服務(wù)。而政府信息公開就是很大的服務(wù),那么它的服務(wù)會不會細分?會怎樣細分?

  王志庚:

  我覺得肯定要出現(xiàn)細分,無論從供給方還是從需求方,都有細分的要求。我們這里看細分有兩點,一個是分層服務(wù),另一個是分類服務(wù),也就是分內(nèi)容、分主題的服務(wù)。

  分層服務(wù)是按行政機構(gòu)建設(shè),國圖整合中央,服務(wù)中央;省圖整合省和地縣級信息,服務(wù)地方;還有其他的業(yè)態(tài),如:搜索引擎或一些商業(yè)機構(gòu),也可能會做這樣服務(wù)。在我們來看分層服務(wù)的內(nèi)容主要有兩種,一種是信息本身的獲取和瀏覽,另一種是一般的檢索發(fā)現(xiàn)提供的這種增值服務(wù),這是服務(wù)本身的附加值。

  分類服務(wù)方面,從圖書館來講法律方面,特別是商務(wù)、經(jīng)濟,以及文化都是增值服務(wù)的熱點。

  在商業(yè)方面,如:區(qū)域政府會公布招商引資條例,不同的開發(fā)區(qū)域會有不同的優(yōu)惠措施,這些都是政府信息。這些信息往往會隨著時間變化而變化或隨著中央指示精神而變化,企業(yè)對這類信息的需求非常迫切。

  關(guān)于法律信息,在國際化的大進程中,中國法律的海外需求非常多,外國人想知道中國政府的態(tài)度和我們國內(nèi)的法律和政策環(huán)境,這需要法律信息的外銷問題。

  筆者:

  Google 和Baidu 等搜索引擎的排序,采用PageRank算法,網(wǎng)頁關(guān)聯(lián)的越多,排序越靠前。這種信息關(guān)聯(lián)在政府公開信息增值服務(wù)中是不是關(guān)鍵點?

  王志庚:

  信息關(guān)聯(lián)是信息(知識)服務(wù)中非常核心的內(nèi)容,分兩個層次,一個是文本層,一個是語義層,我們所說的信息關(guān)聯(lián),和搜索引擎提供的信息關(guān)聯(lián)有著本質(zhì)的區(qū)別,我們把他叫作語義分析,把信息本身放到上下文中,利用圖書館的人工或自動的方法或模型測算出來,這一網(wǎng)頁或信息本身與他相關(guān)知識點是什么,這些知識點又會衍生出來為用戶推薦什么信息,這個往往具備搜索引擎所不具備的。搜索引擎會根據(jù)點擊量和流量,還有一個排名問題,我說的這個是一個語義上的關(guān)聯(lián),信息進庫是孤立的,經(jīng)過增值處理,組織之后所有信息都是關(guān)聯(lián)的,一個新聞或網(wǎng)頁會成為一條線,一個線會帶一個面,一個面會沿展成一個立體。

  國家圖書館正在建設(shè)的國家數(shù)字圖書館已經(jīng)籌建了若干中文語義服務(wù)的基礎(chǔ)設(shè)施。比如,我們的一個服務(wù)叫關(guān)鍵詞分配的技術(shù),任何信息符合端口可進來,出去就是標準的東西出來,這是一種基礎(chǔ)服務(wù)。政府網(wǎng)站給關(guān)鍵詞的時候,你把你的文本放到國圖的箱子里,出去的時候就有國圖給你的若干個標準的關(guān)鍵詞,這個關(guān)鍵詞是全國統(tǒng)一的,這將是一個開放的網(wǎng)絡(luò)服務(wù),當然還有很多,我們可以把這種知識服務(wù)稱為未來語義網(wǎng)絡(luò)的基礎(chǔ)設(shè)施。

  筆者:

  您今天談到的兩點,一個是打造政府信息的數(shù)字圖書館,另一個是建設(shè)語義網(wǎng)絡(luò)的基礎(chǔ)設(shè)施,無論從技術(shù)方面還是應(yīng)用方面我想都會給讀者很大的啟發(fā)。

  王志庚:

  國圖將要與TRS合作的“國圖政府信息整合發(fā)布平臺”項目在國際上就沒有同行業(yè)在做,它是與網(wǎng)絡(luò)信息采集保存相關(guān),與信息整合服務(wù)、文本挖掘知識組合。我們圖書館人必須把政府信息整合服務(wù)作為圖書館價值再造和戰(zhàn)略發(fā)展的一個新領(lǐng)域,我們也有一個愿景:希望公眾找信息去圖書館,圖書館是一個可信賴的政府公開信息的收集者、組織者和增值服務(wù)者。

責任編輯:admin