关于伦敦数据库的探讨

艾莫尔·科曼

我从2005年起在伦敦的地方政府工作,在20093月,我进入市政厅开始进行一项由大伦敦政府、首都抱负(Capital Ambition)项目及社区部门和各地政府所拨款赞助的研究项目,为期一年。该项目旨在研究各项政策如何在大伦敦境内的自治市镇中运作,尤其要考察他们对新媒体和技术的使用,并分析他们如何运用定性的研究方法。不久前刚刚上任成为大伦敦政府首席行政长官的利奥波兰德(Leo Boland
曾主导过一项研究,而这个项目恰好是建立在早前研究的基础之上的。

2008年我与波兰德曾在《公共财富及管理期刊》上共同发表过一篇题为《服务之外有什么?地方政府所塑造的领导力行为》的文章(Boland, L. &艾莫尔·科曼2008年),其中指出我们了解到当时的政府正如何致力于引导公众提高对某些领域的认知,如降低浪费和肥胖问题,及服务业的合作等。特别值得一提的是,我们深受以下观点的影响:

假如公共部门没能发挥其用户所生成的内容的效用,那么它看起来不仅仅是陈旧过时,在继续创造公共财产的时候更显得生产力低下和缺乏效率 (Leadbeater,

C. & Cottam, H., 2007)

我们都认同,公共服务变革所面临的最大挑战并不仅仅是像新一代的客户服务网站如亚马逊(Amazon.com)那样使其更有效率以及更为可靠这么简单,而是要让其更为公有化和集体化,这就意味着鼓励更多的市民参与其中。对我们而言,开放数据似乎成为提高参与度的重要部分。

已有一些标志性政策在为此铺路。在2008年,在英国处于中央政府级别的信息势力特别小组(由劳务大臣汤姆·沃森牵头)举办过一次主题为你将用开放化信息创造什么?”(“What would you create with public information?”)的竞赛,优胜者奖金丰厚。而在伦敦,作为鲍里斯·约翰逊角逐市长的竞选纲领中其中一项就是承诺将向全体市长顾问印发一份公开名册,以及在市政府网站上提供搜索功能供所有伦敦市民可迅速查找所有金额超过1,000英镑的补助金、合约以及项目等。值得一提的还有,总统奥巴马在他2009年的第一个工作日所发布的开放政府指引中承诺了三大原则透明、参与及协作,作为其政策上的基石迈出了重要的一步。

市政厅视角

在推动公共数据开放化的过程中,强有力的政策领导具有不可低估的重要性。然而,政府官员有时却会低估他们在这方面的领导作用,这十分有趣。鲍里斯·约翰逊市长在市政厅里有多位市长顾问,他们全部都与英国保守党成员联系紧密(当时的反对党),并且是能够理解技术重要性的一代人。

他们当中包括新闻主管吉托哈里(Guto Harri),宣传主管丹尼尔利特班德(Dan Ritterband)等都与大卫·卡梅隆的前战略主管史蒂夫希尔顿(Steve Hilton)关系密切。其中希尔顿还是谷歌公众事务及通讯部全球副总裁蕾切尔惠特斯通(Rachel Whetstone)的丈夫。这些人全都支持市长为伦敦推动一项名为「伦敦数据库」(London Datastore)的官方开放数据门户,来履行他的竞选承诺。他们还密切关注保守党阵营在2010年大选前的全国性地位。

尽管2010年的保守党宣言中并没有在两个类别的竞选纲领中提及开放数据的作用,但从它名为打造更为透明的政府从而改变社会” (“ Change Society to Make Government More Transparent”)的口号就对开放数据做了明确的表述。从政策的角度,字里行间中可以看出,似乎保守党所聚焦的开放数据在于透明而并非开放数据可能造成的分化局面。它并不是将关注的重心放在开放数据可能在刺激经济活动或管理技术的潜在作用上,进而对市民有益,但它足以开启一扇大门并足以使伦敦数据库的建立成为可能。

定义

2007年,一个由蒂姆奥莱利(Tim O’Reilly)及卡尔·马拉默德 (Carl Malamud[1] 所主持的工作小组给出一项构成开放数据内容的定义。在之后的文件中引述了开放数据运动中广为提到的八项原则,以此来判断数据是否具备开放性。这八项原则包括:完整、即时、便于获取、可使用机器处理、公平、无需注册、非专利、以及不受任何产权或专利管辖(Open Government Working Group, 2007)。加拿大的开放数据运动家大卫伊夫斯(David Eaves)则将定义简化为其具有影响力的「开放政府数据三项准则」:

1.假如一项数据无法被公开搜索到,则不存在开放性;

2.假如一项数据无法公开且提供机读格式,则不可列作开放性;

3.假如在法律的框架下,一项数据不可用作其他用途,则其无权开放。

Eaves.D2009

伊夫斯的上述定义为开放数据提供了非常简洁的注解,因此我也深受其影响,尤其在早年,当时对这一概念的潜力所知甚少,而且很难找到具体、实用的例子。

开端

为了着手建立伦敦数据库而开始确立范围的程序时,我曾成立过一个小型的内部小组。

这个小组的成员中,既有来自大伦敦市政府的数据资产管理部门,也有来自技术部门的工作人员。而这些成员在一开始都主张采用专利软件搭建一个网络平台,而当时初始原型已经建立。鉴于我的立场是确保政策应当是一个双向的过程并且可以开放参与,因此我力争方法应当有所转变,而首先要做的,就是把确定范围的程序向那些最有可能使用数据的人们开放也就是开放数据运动中的技术人员及活跃分子。

要围绕政府数据,尝试开发一个成功的约定模型,社交媒体(尤其是推特)的作用不容忽视。在20091020日,我们通过伦敦数据库的推特账户(@london-datastore)推送了一条名为帮助我们实现伦敦数据自由化”("Help Us Free London’s Data")的呼吁,给出了下面这篇邀请信的链接:

大伦敦市政府正着手打造伦敦数据库。我们初步的建议是发布尽可能多的大伦敦数据以鼓励伦敦其他的公共部门效仿这一做法,而我们十分乐意提供帮助!我们希望在任何平台上或以任何形式作出决定之前能够吸纳外部的数据到开发部门中来,这样我们就可以与您商讨想要做的事,征求您的意见,以及取得您可以对伦敦投入的最佳方案。(《帮助我们解放伦敦数据》,2009年)

在接下来的星期六,这封邀请吸引到了超过60位开发者来到我们位于伦敦市政厅会议室的开放性工作室。我们也从将要在之后的几个月里帮我们管理的技术部门那里得到了明确的讯息,了解到他们在许多年来尝试发布开放数据,结果却落得深感挫败感、愤世嫉俗,交通运输和犯罪领域的工作尤其给他们倍感如此。我们也听取了他们的担忧,也就是现在政府的结构可能导致该项目无法进一步开展下去。

更重要的是,他们告诫我们要丑话说在前面,不要和当时的政府犯同样的错,就是为求完美却没有先将事情做好。他们表示,只要数据的格式不是PDF文件格式的,他们都可以接手处理,而且可以帮助我们在无损现状的基础上协助我们恢复。通过共事,我们可以让整件事朝着更好的方向发展这是发布数据过程中的重大时刻。

我相信,从一开始持开放的态度就是伦敦数据库成功的关键因素。曾在卫报公开平台发起时任互动参与策略师的技术专家克里斯索普(Chris Thorpe)在后续博客中写道在其后的博客中写道:

在一个组织开展某件事之前,能够被邀请到它的大本营,往往预示着一段良好的开放关系。,而周六的几位大伦敦政府官员参与其中同样告诉了我他们对这件事的密切重视。(Thorpe2009

我在政府部门工作了三十年直到最近,主要是在沟通及交流的部分,之后转向政策及策略。我花了很多年尝试把政府的艰难处境向漠不关心甚至是对立阵营的选民解释清楚,而由克里斯这样这样一位受人尊敬的来自技术阵营(或与此有关的任何阵营)的成员为政府提议做出第三方的代言,我认为是十分强有力的。我相信,世界上所有希望弥补民主赤字的政府都会需要更多这样的保证。而开放,是唯一的实现办法。

不过,一旦你开始了开放性的进程,你就必须继续保持开放态度,而这也终将是数据开放的真正难题所在在伦敦数据库于201017日上线之后,我在博客中写道:

17日,我们承诺要在129日之前把数据组从50个增加到200个。而因为大伦敦市政府的数据资产管理部门加雷思贝克(Gareth Baker)的出色工作,我们刚刚做到了。自此,我们已经跟负责的部门包括伦敦交通部门、警署、伦敦开放机构、奥运开放团队以及伦敦消防和应急策划局(LFEPA)开过或多或少一系列的会议。这些会议主要是在跟开发部门的代表进行,包括乔纳森雷珀(Jonathan Raper)教授、克里斯塔加特(Chris Taggart)及汤姆卢斯莫尔(Tom Loosemore我们很高兴的看见来自开发部门和代表公务员的不同文化之间能够互通有无。

所有的负责部门都达成共识,认为数据库这个主意不错并且承诺将在未来数周和数月内开放他们手上的数据。我们认为这或许未必能完全满足开放团队的迫切需求---但是,还是让我们留有一些余地吧。因为商讨总是费时的,某种情况下甚至会举步维艰。让我们不要对此放不开--因为要让公众对开放数据表现自然需要公共部门中大幅度的文化转变。但我们全部的会议结果都鼓舞人心并且很确定这一进程向着快速和更好的方面转变。Coleman, 2010

咬文嚼字

不过,在现实中,事情似乎有点不像表面那样乐观。我的博客曾试图在管理开发者预期和公开正面临的挑战之间划清一条界线。作为替大伦敦市政府部门工作的公务员,我不可以公开批评在公开数据过程中遇到的不情愿和阻力。如果这么做,将有可能削弱市长的威信并暗示在大伦敦市政府部门中存在分歧。

自从我开始把利益相关群体的期望提高到一个非常公开的层面后,现在所面临的实际情况是,发布运输和犯罪数据的时间将会相当漫长。尽管市长已明确表示了他预计在伦敦数据库上线时可以自然呈现出公开透明的意愿,但很明显,负责实行这项政策的多位公务员并不倾向于遵循这一愿望。

我所面临的阻力并非仅仅是针对某项特定提议而孤立出现的,而更像一种根深蒂固的官僚主义。这通常跟政府一贯的保密文化有关(Bennett, 1985;Worthy,2008),同时也涉及政府把国家数据公开流通所进行的尝试(Burket20004)。

其他的评论家则表示,在公开发布政府数据过程中有三个层面的推动因素。可以区分的因素有三组:公民社会、中层及上层的公务员,所有起作用的因素都要参与其中以确保开放数据项目的成功。”(Hogge2010)。有趣的是,在公民社会中,霍格(Hogge)认为公民黑客尤为重要。

我同意她有关公民黑客的部分观点(我更喜欢称他们为数据干扰者),但我并不认同她所挑选出来的这些推动因素。我认为应当参与其中的三个要素应该是国家、公民社会及传媒。当时我作为一名公众官员,无法在官方层面公开表述发布数据所遭遇的阻力,我只能在数据库的网络中简要提到数据干扰者。他们在博客中提出问题,并且通过他们的网络(社交以及其他)公开向当地和中央政府的联络人施压。

同样地,媒体的作用也不容忽视。《卫报》的技术编辑查尔斯亚瑟(Charles Arthur)在伦敦数据库建立一事上功不可没,他勾勒出了一种政府和传媒之间可能存在的新型关系,作为开放数据的长期支持者,查尔斯认识到国家对进入这一领域慎之又慎、对他们强调开放数据的好处极为重要。他对这一项目给予应得的赞许,而不是像一般媒体对于国家进行新的方向上的尝试时多数采取的知道了这样的立场。他曾在20109月写过一篇影响重大的文章中赞扬了伦敦运输部门和伦敦市长:

你可能认为鲍里斯约翰逊的露面表态略显哗众取宠,但并非如此。事实上他一直都站在了引入开放数据的政客一边,如果你清楚开放数据事宜的漫长历史,你一定记得,其实在2008年竞选市长的纲领中,他曾游说劳动行政主管人员,并声明他想发布犯罪地图。之后他确实做到了,而伦敦也从那时起就因为其当地政府和机构利用收集到的数据进行创新性尝试而走在了众多城市的前沿。Arthur2010

从整个英国的角度来看,这可能不值一提。《卫报》公开赞扬一位保守党市长的影响是引人瞩目的。要知道,该报是一份具有象征意义的刊物,且保守党的时事评论员将其认为是左翼的阵地。

接下来所发生的事

发布数据既不是一蹴而就也并非总是如愿以偿的。比如,我们一直明白公布伦敦巴士数据将大大改变城市的现状,因为众多伦敦市民都极为倚重巴士网络。我们与伦敦交通局就披露巴士数据探讨过数月,这就足以表明英国在推动技术的速度上不尽如人意,尽管我们在这条路上已经走了很长的距离。在我与伦敦交通局的一次会议上,伦敦交通局负责发布数据库的官员曾列出一项时间表,包括在伦敦交通局网站上刊发有关数据,之后需要六个月的时间开发者才能发布一份官方的应用程序。

开发者们和官员曾解释过,一旦数据在伦敦交通局的网站上线,他们就可以轻而易举的用这些数据开发出应用程序,当时双方争辩激烈。几天之后,我接到一位伦敦交通局官员的电话告知,在考虑过之前的讨论后,他们认为可以把发布数据的时间缩短到三个月(这样就正好跟伦敦交通局发布他们预定并已经付费的一项全盘市场推广同步了)

不过,在谈话即将结束的几个小时里,我开始留意到有几条有趣的推文可以看出伦敦交通局已经发布了他们的巴士数据,那么接下来的就是不得不要跟他们开始非常不切实际的对话。对话的结果就是有关数据其实早已流通在伦敦交通局的内网上,而现在有人通过电邮将这条链接对外发布了,开发者们立刻蜂拥而至开始了应用的开发。

让你的那些开发者们不要再摆弄这些数据了深陷事件中的伦敦交通局官员恳求我,为对此事可能对正在计划中的推广活动造成的损失感到非常惋惜,更担心因此造成伦敦交通局服务器的数据负担。我不得不解释,我对开发者们所作的并不完全知情,并询问他是否听说过打鼹鼠这个规则。

一旦魔鬼已经从瓶子里跑了出来,它对系统造成的影响就不是可以简单处于控制之中了。由于伦敦交通局已经发布了如此多的实时数据,那个将数据链接外泄的人都有理由辩解他们没有任何理由不继续开放这些数据。开放后带来的是更多的开放性,而原本拥有控制能力的组织可能骤然失去操控力。

三年之后

不得不说,现在的我已经由一个闯入别人领域的偷猎者变成了应对擅闯的看守者。最近我已经离开政府部门加入了交通API,而这正是基于开放数据建立的商业模式,包括伦敦运输局公布的数据在内。作为开放数据的汇集者,可以预见,假如政府发布了开放化的数据,那么我们已经身处将要建立起来的这幢大厦的截面上。我们的平台不仅面向为伦敦编制城市交通地图的开发者,加上我们的搭档埃尔金(Elgin,另一个开放数据公司),我们还正在向英国境内的其他地方政府按低于现有的成本提供智能化的交通解决方案,条款和条件则优于现状。此事取得了令人难以置信的成功。

我们的办公地点在位于伦敦的开放数据研究院,而在我们身边的都是像我们这样基于开放数据的初创企业。

我们在乳齿象C公司(Mastodon C)的同事从事大数据和与健康有关的数据方面的工作,最近在《经济学家》上发表了他们对于处方的研究报告,研究表明通过采用一般处方药物的非注册类型药物,可以为国家医疗服务省下庞大的开销。非盈利机构中还有我的社会mySociety)这样的组织,麾下还有提供实时地图的Mapumental、让人们向当地机构报告道路问题的FixMyStreet、供人们联系英国公共交通机构的FixMyTransport等。当然,还有像克里斯塔加特这样构建企业开放数据库OpenCorporates我们这些公司的共同愿景便是为民众创建一个更好、更公开、更有效率的社会环境。而正因为我们深信这一点,我们如今正在努力实践着三年前我们便在谈论着的开放数据事业。

我还为技术战略理事会(TSB)创办的数字经济技术与创新中心(Connected Digital Economy Catapult)担任顾问工作。该中心主要致力于支持将英国的顶尖数据创意推广到市场。而推动开放数据的协作能力,发挥数据在数字化经济价值链上的多重功能是其中主要目标之一。我所希望的是,作为一项主要的新生基础设施,在同样由技术战略理事会成立的未来城市发展中心的协助下,能在未来数年间为发布更多样化的数据提供进一步的促进和支持。

我认为,和在公共领域将开放化数据变成政策范围的一部分所遇到的挑战相比,在私有领域面临的问题有所不同但不会相去甚远。智能化城市竞赛已持续相当时日,一份由洛克菲勒基金会委托制作的2010年的报告(《城市、信息和包容性的未来》,The Future of Cities, Information and Inclusion)中就证实了我在市政厅作为数据化项目主管的经历。这份报告显示,受简雅各布斯(Jane Jacobs)的影响意在争取自助式管理的黑客行为与后来罗伯摩斯(Robert Moses)影响下谋求IBM或思科自治的行为,这两者间存在潜在冲突。这篇报告还认为如果大型公司不能与政府新的自治精神中谨慎取得平衡,那么城市中的穷人阶层将是最大受害者。

大公司跟政府都需要知道的是,你们必须先合作才能竞争,必须先接纳开放性才能继续运作,必须改变以市场优势为先的观念。在这个过程中我们可以创造收益,但收益并不需要牺牲为市民带来更好的条件为代价。我们所有人,不论是在国家部门的还是私有部门的,都需要首先寻求什么才是对公众价值最好的,然后我们应当共享已有的资源去实现它。接下来的旅程将是激动人心的。

关于作者

艾莫尔·科曼是伦敦数据库的建造者。她还身兼记者和顾问,主要撰写技术如何影响组织发展。她是数码与技术领导力专家(DSRPTN)的创始人,领导力和变革方面的专家顾问,以及交通官方程序界面的业务主管,致力于推动交通方面的创新和变革。她被《连线》杂志(Wired)提名为2011年数据化影响力的100位先驱之一,持有科克大学的历史学和社会学学士学位,以及沃里克大学商学院的公共管理硕士学位。

参考文献

Arthur, C. (201093). Another Data Win: TfL Opens Up Bus and Tube Timetables for Developers. The Guardian.

Bennett, C. (1985). From the Dark to the Light: The Open Government Debate in Britain. Journal of Public Policy, 5 02), 187-213. doi: 10.1017/ S0143814X00003020.

Boland, L. & Coleman, E. (2008). New Development: What Lies Beyond Service Delivery? Leadership Behaviours for Place Shaping in Local Government. Public Money & Management, 28 (5), 313-318.

Burkert, H. (2004). The Mechanics of Public Sector Information. In

G. Aichholzer and H. Burkert (Eds.) Public Sector Information in the Digital Age: Between Markets, Public Management and Citizens’Rights. Cheltenham: Edward Elgar Publishing Limited.

Coleman, E. (2010215). Hectic Times.

Eaves, D. (2009930). The Three Laws of Open Government Data.

Greater London Authority. (2009). Help Us Free London’s Data.

Institute for the Future & Rockefeller Foundation. (2010). A Planet of Civic Laboratories: The Future of Cities, Information, and Inclusion. Palo Alto, CA: Townsend, A., Maguire, R., Liebhold, M., & Crawford, M.

Leadbeater, C. & Cottam, H. (2007) The User-Generated State: Public Services 2.0.

Open Government Working Group. (2007128). 8 Principles of Open Government Data.

Open Society Foundations. (2010). Open Data Study. London: Hogge, B.

The Conservative Party. (2010) The Conservative Manifesto 2010.Uckfield, East Sussex: The Conservative Party.

Thorpe, C. (20091025). A Good Way to Start Building a Data Store for London.

Worthy, B. (2008). The Future of Freedom of Information in the UK. The Political Quarterly, 79(1), 100-108. doi: 10.1111/j.1467-923X.2008.00907.x.

译者注

[1] 卡尔·马拉默德 (Carl Malamud),著名的公共资源索引网站 Public.Resource.Org 的创始人公共信息和数据开放性的前驱人物。更多资料http://en.wikipedia.org/wiki/Carl_Malamud