新用戶登錄后自動創建賬號
登錄近日,阿里數據經濟研究中心(ADEC)以數據經濟新型智庫平臺的角色,牽手清華大學公共管理學院舉辦了一場主題為“政府數據開放的挑戰、困惑與探索”的沙龍。本文為本文為復旦大學移動與數字治理實驗室主任鄭磊在沙龍的精彩發言。
我們實驗室最近選了七個開放政府數據的城市和城區做了研究評估,今天先給大家匯報一下這個報告的發現,然后再講一下我們在各種研究和案例調研中發現的一些開放數據中的難點,然后提出一些可能的路徑和建議。
關于政府數據開放的概念
開放政府數據跟之前的信息公開是相關的,但是這兩個也有重要的差別,現在我看到有些報道把政府信息公開和數據開放等混在一起,信息公開是保障知情權,公開的大多是一些文件、政策,也公開了一些數據,主要是為了保障知情權,也就讓你知道的權利等,而數據開放則是強調利用權,我們在評估數據開放平臺的時候,這是一個重要的切入點,如果你把數據上傳到平臺只是讓大家去查詢,而無法利用,那就只是公開而不是開放。所以公開和開放是兩個概念,我們在調研當中發現有一些網站,他說是數據開放,但其實只屬于數據發布和信息公開,不是真正的開放,因為沒法下載和利用這些數據。
下一張圖,縱軸上是信息層和數據層,數據層是底層的,對數據層進行加工和解讀才成為信息,橫軸上從左到右是知情,有限利用和自由利用,傳統的“政府信息公開”是在知情這個層次,過去提到過的“政府信息資源再利用“主要指的是有限利用,政府把信息給幾家比較信任的公司,只讓他們來開發利用,這就是有限利用,不是平等的、開放的自由下載和利用,其他的公司得不到這些數據就沒有辦法開發利用。
數據開放是要開放到數據層,同時又能保障自由利用,大家有平等的使用的權利。雖然“政府信息公開”有時也達到了數據層,但更多的是數據查詢服務和數據發布,并不能讓人下載利用這些數據。政府開放數據的思路把數據層跟應用層分開,政府提供數據,但政府自己不再需要把數據開發成應用,這時政府依然在提供公共服務,但不再需要自己生產公共服務,而是與市場實現合作共創,共同為社會創造價值。
舉一個例子,如果我們把數據當成底層資源,數據相當于大米,我把大米開放給社會以后,社會是可以做成各種飯的,取決于他想吃什么飯,他善于做什么飯,以及社會需要什么飯。如果政府自己把米做成了蛋炒飯,就面臨三種情況:
別人想不想吃蛋炒飯?如果別人只想吃白米飯怎么辦?眾口難調怎么辦?
政府自己來開發數據需要花財政的錢,而開放數據給市場來開發花的是市場的錢。
政府能做得比市場好嗎?有那么多的人和時間來開發一個個的應用嗎?
市場的需求越來越多元化,政府的投入總是有限的,能忙得過來嗎?結果就是政府自己做的很辛苦,但吃力不討好。其實政府只需開發一些基本的應用作為公共產品,個性化的應用讓市場自己去開發就可以了。
中國政府開放數據現狀與問題
我們對于開放數據的研究,目前得到了三方面的資助,包括國家自然科學基金,世界銀行開放數據能力評估與建設課題以及上海市開放政府數據三年規劃課題。我們去年首先做文獻理論和框架構建,今年開始做現狀評估。我們參考了國際上知名的針對各國的開放數據評估報告,這些報告主要是針對國家層面的,而我國是地方層面現行探索,國家數據開放平臺尚未推出,所以目前尚缺少對中國地方政府開放數據現狀與問題的研究。我們希望通過該研究建立一套適用于中國國情的地方政府開放數據實踐評估框架,呈現和評估中國地方開放數據實踐的現狀與問題,然后為我國開放政府數據實踐提供政策建議。
我們首先對國際上的十幾種開放數據報告進行梳理,然后探索建立適合中國的評估框架。我們決定首先針對供應端,也就是政府開放數據平臺進行評估,國際上的評估報告同時對供應端和需求端進行評估,比如開放數據500強,哪些公司利用政府開放的數據,給他建立500強,這是對需求端的評估,但是中國開放政府數據剛剛起步,還沒發展到這一步,目前的工作主要集中在數據的供應端,先要把數據開放出來,才談得上對應用端進行評估,所以我們這次的評估報告主要針對供應端。
我們采用三個一級指標:平臺層、數據層和基礎層,下面有13個維度和53項指標。第一個是平臺層,然后是數據層,平臺建的再好,上面沒有干貨的數據也不行,這個是更關鍵的,在表面的平臺層和數據層之后,還有基礎層,更多是指體制機制的支撐,經濟社會的基礎,而不是指技術上的基礎設施。我們這次報告采集的數據主要來自互聯網上公開可見的數據和信息,不包括從政府內部得到的信息。我們選取了幾個比較有引領性的、有代表性的七個地方,北京、上海、武漢、無錫、湛江、寧波海曙、佛山南海。
首先看數據層,這七個地方平均公開278個數據集。武漢號稱最多,他是635,但是有一半是PDF格式的,可機讀比例僅54%,不能讓人直接利用,其實還是以信息公開為主。可機讀數據開放最多的是上海市,一共有398個數據集,各地平均可機讀率是84.1%。各地平均有86.25%是靜態數據,僅17.21%的數據按承諾得到了更新。僅無錫、海曙明確保障數據的永久免費;各地的開放數據中,0%明確賦予并保障自由增值、解讀、分享數據的權利。
總的來說,現在開放數據總量還是偏低,可機讀性差,大多為靜態數據,數據按承諾更新比例低,整體都未嚴格符合開放授權。
然后看平臺層,各地方平臺包含三個模塊,一個是數據導引,一個是數據獲取,一個是互動交流,這是雙向的,你需要什么數據或者提一些問題。我們發現,只有無錫和湛江是無需注冊即可下載數據,開放出來的數據既然已經經過了國家安全、商業機密和個人隱私的審核,開放之后誰來下載利用應該是自由便利的,不一定非要注冊跟蹤,當然政府也確實想知道開放的數據產生了怎樣的效益,有利于下一步的開放。
開放數據本身不會直接產生價值,只有開放出來的數據被社會利用了才真正有意義。各地都開設了應用展示頻道,展示市場上基于開放數據開發出來的應用,這樣就形成一個循環,政府開放數據市場拿去用開發成應用,然后政府的開放數據網站上還成為一個展示這些應用的一站式的平臺,這樣首先政府一方面知道了誰利用了我開放的數據,更重要的是也讓公眾容易找到這些應用。展示應用數量最多的是上海,列出APP共 78個,各地平均APP數量為20個,但需要指出的是,這些展示出來的應用很多并不是市場開發的,而是政府自己開發的。
研究還發現僅寧波海曙一個地方公開了用戶提出的數據請求,其他的地方只有政府后臺才能看見這些請求。對比國外的開放數據平臺,用戶在提交數據需求后,還發起了附議的行動,其他有同樣需求的公眾可以點贊附和。報告還發現,僅佛山南海開設了社交媒體帳號向公眾傳播開放數據信息,僅上海一個地方實現了數據平臺的移動端適配。這些數據都是截止到五月底的數據,我們希望每半年更新一次這個數據。在平臺層的總體現狀是普通交互便捷性差,缺乏高質量數據應用展示,溝通交流缺乏便捷性、有效性和公開性。
在基礎層,數據開放已經從特大型城市擴展到不同地域、不同規模的地方,但依然集中于沿海一二線地區,經濟通常較為發達,政府信息化基礎相對較好、IT產業發展具備一定潛力的城市。針對開放數據的專門政策和工作方案普遍缺位,管理體制和領導力支持尚不足以支撐工作推進。從體制保障來看,僅南海、上海建立了專門針對數據統籌開放的主管單位,特別是南海成立了數據統籌局。僅上海公開發布了開放數據的針對性政策和工作方案。僅上海、南海有公開報道高層行政領導對開放數據的支持。
總體來說,上海跟南海兩地整體數據開放水平最高,武漢、寧波海曙相對偏低。
然而,如果把上海跟紐約在一起比,差距仍然很大。上海是31個部門開放435個數據集,紐約是98個部門1831個數據集。當然,我們不能光看數據集的數字,還要看數據的價值。我還想重點指出的是在開放數據集的同時,還要開放元數據,元數據開放才會讓大家更多了解數據的背景,告訴我們數據什么時間采集,如何采集的,然后在利用的時候就能用得更好,也會發現原來有些開放的數據集并不是自己想要的??梢钥吹郊~約市開放的元數據字段有22項,而上海市是13項。再有是格式的多樣性,紐約是五星指標,說明格式種類很豐富,而上海是二星指標,因為其開放的數據主要是EXCEL格式為主。這幾個關鍵指標其實代表了數據是否能被容易便利地利用。
政府數據開放的六大難點
第一個難點是很多部門不知道數據在哪里?你問他數據,他說我沒有,有時是真沒有,一些政府部門確實沒有采集這樣的數據,但有時其實是他不知道他有,有些部門自己都沒有數據清單,不清楚自己手上到底有什么數據資源。
第二是難點是能不能開放。這個是政策的角度,涉及到國家安全、商業機密、個人隱私的數據不能開放,但我們的法律法規有些是模糊的,甚至是沖突的,這種情況下負責開放數據的工作人員一般會偏向于保守,就是傾向于不開放數據,這樣對他們自身更安全。
第三個難點是愿意不愿意開放,這個就涉及到部門利益了,明明是可以開放,但是也許是有一些顯性隱性的利益。我一開放出去,我的部門利益就沒有了,所以就不愿意開放。
第四個難點是數據好不好?即使前面幾條都解決了,但這些數據是有問題的,不準確不及時或不全面,這樣開放出去之后,不僅不會產生價值,還可能給社會造成損失。所以還需要提升數據質量。
第五個難點是能力夠不夠,開放數據能力建設對政府部門來說是一個全新的挑戰和全新的工作,有沒有專門的部門負責這個工作?需要在管理層和技術層進行能力培訓,需要交流經驗。
第六個難點是動力有沒有,就是多一事不如少一事的組織文化,有些政府部門會覺得多做多錯,少做少錯,不做不錯,不如先觀望一下。
關于政府數據開放的建議:培育開放數據生態圈
最主要的建議是開放數據要整體性系統性的思考問題,這是一個生態系統,這個生態系統中最大的兩個群體,一個是政府,是開放數據的,另一個是市場,是利用數據的,要培育、輔導和支持生態圈的形成,讓數據被開發出來,被利用起來,對整個社會產生價值。這兩大群體又受到內外部環境的影響,即使一個地方的政府非常愿意開放數據,但這個地方的經濟社會信息化環境并不利于數據的開發利用,用不起來,無法產生真正的社會價值,那也無法產生效果。
政府作為開放數據的提供者,需要考慮管理體制、組織架構方面的變革,需要同時在數據管理和開放平臺建設兩方面下功夫?,F在國際上數據開放的會議上,這兩年我聽到的更多是在討論誰來用數據?干什么用?利用者之間的差異如何?美國政府在最早推出政府數據開放平臺后,就發現缺少對基礎用戶的支持,因為數據開發能力不是每個普通老百姓都具備的,以前我們說數字鴻溝,現在可能會形成數據鴻溝,中間誰把這個鴻溝連上?數據開發公司可以作為中間的橋梁,把數據開發成應用,為社會上的普通公眾服務,所以政府要把這些數據開發公司視為合作伙伴。數據的利用者能力非常關鍵,機構用戶、增值開發者、一手用戶、二手用戶等等是一個生態圈,各自發揮不同的作用,你把一個干掉了,可能另一個也消失了,所以我要有生態圈的意識,不要隨便的干預,除非他們觸碰到了底線,但也不要隨便的去扶持誰,這樣可能會破壞生態圈的平衡。
開放數據會產生一系列政治、經濟和社會的效益,但也有損失與風險,要看最后帶來的收益大于損失,還是反之。如下圖我們構建的系統動力圖所示,未開放的數據開放出來之后,本身并沒有直接產生價值,必須要被利用,變成被利用的開放數據之后,才會產生或者是收益或者是損失,這個價值反饋回來會影響到整個社會、經濟、技術、創新等環境,這些環境越有利,就會越支撐政府開放數據的機制建設,開放平臺建設和數據管理,數據質量和數量都上去以后,開放的效果也會越好,形成一個正循環。反之,如果開放數據造成的風險高于收益,社會環境中都在反對這個事情,或者政府開放出來的數據沒有什么價值,不是社會真正需要的,因而沒有人來利用數據,就都無法形成開放數據的正循環,所以要有一個生態圈的思維,要讓這個系統向正循環的方向走,而不是負循環或循環不下去??偨Y起來,就是開放數據這項工作是一個復雜的動態的過程,涉及到多個利益相關方,存在多種因素的互動關系和因果回路。但一切要以公眾需求為出發點,以創造公眾價值為終極目標。