第九章

奥克兰及其开放城市的探索

史蒂夫·斯派克

在美国的海湾地区座落着一座城市,它像美国很多老旧而庞大的城市﹝其中大部分位于夕阳工业地带[1]﹞一样,饱受投资不足、白人撤离[2]、学校苦苦支撑、高犯罪率、大量抵押品赎回权丧失、党派及政府贪污以及丑闻的诸多问题所困。尽管现实如此严峻,奥克兰市还是被纽约时报评为2012年全球五个最佳到访地之一,这令我们既兴奋又有些受宠若惊。奥克兰市民一向以其身为海湾沿岸的城市,具有的传承、多元化、传奇音乐人、美食以及惊世艺术为荣。

我们并不如芝加哥、纽约或是旧金山这样的超级城市一般庞大,拥有大量的人口和相应规模的城市服务人员,过往历史上也没有在开放政府运动方面的卓越领导者。但是,我们正在铺就一条通往开放数据的道路,崎岖却令人兴奋。这条道路为我们的城市塑造了多个可行途径—通过一些刊发数据集的实践能看出,政府因此实现了开放和透明。有些通往真正意义上的开放政府,而有些仅仅带来细微的改进或仅仅是一种炒作。

我们的这一历程显示了开放数据为何对一个深陷困境的城市意义重大,以及“极客”[3]们和公众的一些记录会如何为我们的城市带来正面的转变--这些转变是每一个人的,并非仅仅属于我们和“极客”。

开放的开端:取证阶段

改变我的想法以及改变的在我组织中“默认开放”的事件是始料未及且具有变革力的。自从2006年移民美国之后,我获得了在城市战略委员会工作的特权。该委员会是一个社会公正方面的非盈利组织,致力于在城市社区,尤其是有色人种所在社区中支持平等及足以影响低收入群体的政策。

加入这个杰出组织的道路颇为曲折。一开始,我在私人机构担任土地测量规划师,同时涉足伦敦的信息技术资讯业务,之后转投公共医疗主要是从事空间流行病学方面的工作。在私人机构中,我曾为了获取并提交不同的数据而接触政府,从郊区的规划到大型工程项目数据,以及卫星图像。自那以后,我就在西澳大利亚卫生署一待就是几年时间,帮助建立一个全国范围的空间数据库,为劳动力提供支持并促成公众接触政府数据。在此我得以体验国家机器也面临较过往几年都强烈的对数据的独占。通过这项工作,我学到了类似创建、管理以及负责政府数据都需要哪些第一手经验,并经历过控制及限制获取“我的数据”。这份工作也凸显了对数据加密和管理跟支持容易获取之间存在很大的冲突。

离开这个职位时,甚至是从事数据处理的几年之后,让我深受打击的一个事实就是我们部门的人依然不知道存在我们这样一个团队并可以为他们服务。在此后的几年中,我意识到这是大部分的政府部门的通病:我们在沟通方面所做的工作令人害怕--我们的政府不仅难于向公众公开和便于获取,他们也未能做到向内部公开。

在城市战略委员会(Urban Strategies Council),我们对于支持当地政府、社区参与以及非盈利社区等进行以数据为主导的决策方面有较长时间的历史。为达此目的,我们保留自有的数据仓库进行高度以行动为导向的社会研究及空间分析。我们协商可以取得政府数据,签订不披露协议,并获取数据。而有时,我们有足够的运气可以轻而易举的找到我们正在寻找的线上数据。更甚的是,我们的正式目标在于支持实现数据民主化。与我们在National Neighborhood Indicators Partnership (NNIP)中的大部分其他的合作伙伴类似,我们通过建立网络绘图平台来让政策制定者、组织者以及一般公众用简单化的系统取得负责数据,这样可以便于数据在广泛范围内的使用。像其他大部分组织一样,我们的想法就是,正因为人们总是向我们索取地图,我们也需要向他们提供制作的工具。如果稍微与其他组织的现状分离来看,这是一个很合理的回应。人们时常问我们要原始数据,有时候,我们有权发布数据。而有时候,我们有足够的时间把数据发布或寄出到需要它们的人们手中。但更多时候,我们因为上述因素而无法寄送。

海湾地区自动化绘图协会(Bay Area Automated Mapping Association,BAAMA)的一次超乎寻常的会议触发了我对开发数据看法的改变。一名加拿大的年轻人名叫Paul Ramsey,他曾建立了一项了不起的开源空间数据库工具为我们所用,称为空间地理资讯数据库(PostGIS),并在一页粗体显示的幻灯片结束语中表示「你们对数据的使用未必发挥了这些数据的最大效用。」

正是通过这个简单的结论我开始确信,我们可以让其他的人做得更好,理解争议,可以简单地找到数据并加以善用。每一次我们未能将这些数据变得可以公开获取都让我深受触动,我们从一开始就限制了一些重大的改进。当我们每次花光项目经费只求查找、祈求、借用或凑齐所需数据时,实际上我们已经保持着我们经常抱怨政府的事。当我们着手重新建立绘图及数据可视化平台(http://viewer.infoalamedacounty,org)时,这一点突然就变得显而易见,因为我们不得不计划同时开放数据。当2012年我们的新系统上线时,我们是首家(我认为至今仍是唯一一家)基于美国环境研究所ESRI)的系统,它可以让用户轻而易举地下载地图背后的地理数据和原始数据。我们把这个界面和一个集成的拼接数据平台配对,来帮助用户找到清晰处理过且附带价值的原始数据。我的理据是如果我们动用了资助者或是政府的合约资金来购买、清理数据以及对这些数据进行地理编码,那就真的应该让它们发挥更大效用而不是保持封闭状态。

大多像我们这样的非盈利机构或大学都认为面临同样的问题:我们已经收集了惊人的公开及私有数据,但我们的确缺乏资金和人手来让数据完全发挥作用--我对这一事实感到日益沮丧,我们花费数日获取数据而只用来做单一的项目,或许再重复利用几次而已,但数据的真正潜力显然并未实现。在开放我们的数据时,我们已经看到了对自己的身份认知发生改变和数据在可视化方面也有了明显提升。我们仍要争取避免成为数据的看守者—受控之人,而是要力争成为推进剂—在本地网络中连接人们和他们所需数据的节点。这是个值得付出的角色,但更大的回报应来自随着我们从本地区开放数据得益为分析员所带来的转变,从投入大量时间查找数据,转变为着手思考、进行更多实质性的研究并能产生更多影响。

我相信,要在当地政府中广泛测量开放数据,就必须倚赖政府工作人员以及领导者经历我所经历过的类似阶段,限制数据获取并不能很好的胃我们的社区服务。正如我们有政策授权某些记录须在要求时候发布一样,假如管理数据的工作人员不认同你或你的使用方案,那么这项政策将等同于无效。政府的政策既有限制性也有强制性,但最终每一个请求或是每一个新的构想,都会有一位政府官员有其自己的想法、斗争和问题存在。

在我们推动实现开放数据能够遍及全城时,我们决不可以忽视这样的事实。我们用我们的构想正在寻求接触和影响到的是人,而非机构。不过,正如Aaron Swartz(2012年)所说,我们必须修好机器,而不是对人。为了修补我们分散的、封闭的政府,我们必须和人打交道。

   

不切实际的期望

奥克兰市政府长期以来都被视作是信息获取的阻碍,这些信息通常都无法获取除非你是知名人士,受对方尊重。随着我们推出自己的数据系统,我意识到奥克兰不会因为一时兴起而开放数据。它需要的是一个有力的推动:一项开放数据的政策。

我在当地政府中从未制定过一项获采纳的政策,所以开始这项工作相当令人生畏。多亏了在纽约和旧金山进行的工作,我从Code for America Commons网站上可以找到重大政策和具指导意义的例子,加以改编并使其适用于奥克兰(及阿拉米达县)。随后我从大部分其他开放数据的城市里归纳出了优先处理的数据库,并就城市应如何考虑采纳及实施开放数据的方法起草了一些指引。现在我已经掌握了可以再度使用的政策,开放数据在别处如何强有力的好榜样,一些清晰的步骤和指引,以及我认为是“必杀技”的锦囊妙计。现在应该朝哪个方向去呢?我从未进行过游说,但我认为这就是下一步要做的事。

我曾与奥克兰市的多名议员,有时候是他们的主任会面,讨论这项我确信对我们的城市而言举足轻重的新思路。在这些一对一的讨论,我尝试概述了一下开放数据的关键事宜、好处以及奥克兰市对此的需要。我还与他们商讨了推行这项政策可能(适当)的成本。在几次谈话中,突出的反应主要有两点:首先,我很快就了解到,我的“必杀技”并未被认为闪闪发光。其次,我听说我们的市议员那里有各种各样的问题正是开放数据可以帮助解决的。

如果撇开部分术语上的混淆,在每一个案例中讨论开放数据结果都是引起了对这座城市所面临的技术困境的探讨,包括难以取得内部数据,开放信息源技术的好处,以及城市应该通过何种途径更好的与公众互动。市议员对不能轻易获得与城市资产和经营有关的质量数据感到沮丧,因为这样他们就使他们更难以让工作开诚布公,和作出用数据驱动的决策。这些内部收益并非微不足道,每个希望推动开放数据的拥护者同样在寻找符合政府要求的当地案例中表现出色。

总而言之,当我们提到个人福利时,行为的改变或许是最显而易见—这一点,在推动阿拉米达县考虑开发数据时就有类似的经历。要开发一个复杂的内部数据共享设施无疑是昂贵的,进展缓慢且会令人沮丧,但向公众开放数据具有速战速决的政治意义。同时,它还将为政府部门自身提供快速获取新数据的渠道,这在以前是不可能的。

有关开放数据如何在当地促成政府更多地提供、支出以及想象的例子,是犯罪定点(Crimespotting)。作为电脑爱好者几乎凭借开放数据的最早期和最令人印象深刻的例子之一,犯罪定点正是我原先所希望的“必杀技”。这个站点由我的一位好朋友Michal Migurski建立,从FTP服务器上取得每夜表格文件并提供一个简洁、可用的界面,以帮助居民了解所在社区近期的犯罪活动。我曾想通过这个故事展示开放城市的全部数据是如何了不起,对城市而言这几乎是零成本的—然而我错了。在部分市议员对此表示明确共鸣的同时,其余市议员则对这个网站感到反感,加大了我的工作的难度。

那些市议员不喜欢我的“必杀技”的原因主要集中在这个网站并没有提供他们想要的一切,而有关那些令人不快的事件信息会让我们的城市看起来很糟糕。第二项顾虑是一个需要解决的强硬观点,但第一项则意味着机遇。很明显犯罪定点本身对数据的应用并不差,只是市议员没有很好的途径可以获取其所在区域和警区的精确图表、概述统计量、趋势数据以及用户报告—这反映了在城市中缺乏数据分析且某些城市部门的能力有限。同时也凸显了将“问题”转嫁给卖方的趋势,卖方可以创立一个系统进行犯罪报道和分析,但他们并非这方面的专家,所以他们难以在当地环境下全盘分析和传达数据。

这是开放数据的良机。假如城市始终如一地开放他们的犯罪数据,其他人可以建立指定有利政策所需的界面、工具以及报告。我们已经帮助提供了基本的表格文件作为短期所需,但这一需求已经为开放奥克兰(OpenOakland)重新部署CrimeinChicago.org在当地的应用提供了一个清晰的使用案例—它可以满足当地需求并通过利用开放数据显示了与当地领导者产生共鸣的途径。

在我经历了第一次类似游说的行动后,其中一名市议员Libby Schaaf成为了促成开放的内部支持者。与其他城市不同的是,我们没有强有力的行政支持来立即贯彻这项法律。不过,,我们有一项决议允许调查开放数据平台,推动了这项计划获得通过以及与Socrata[4]的一份有关提供这样的平台的合约。

我们正在开放政府吗?

奥克兰已经处在一个奇怪的定位上。我们既有社区推动的开放数据平台,以及一个城市支持平台,但是我们是仅有的几个拥有门户网站却没有立法支持的城市之一(我最近得知新奥尔良处境相同)。更奇怪的是,Alameda县的情况完全一样,他们有网站,而没有政策支持或维护。

在这一层来讲,机遇已经浪费掉了。当城市/县级的工作人员和他们的民选领导人想法一致并不多见,但很精彩。双方都有利益在其中,并表示出对开放数据的极大支持。然而政府工作人员并不认为需要法制而且也未催促。我们的民选政府官员仍通过立法来批准开放数据在城市和县级的应用。

开放数据运动并不完全只是透明化,要找到对开放政府这一概念不感兴趣的民选官员随处可见:更高的透明度以及最终意味着更多可解读性。有关透明化的争议在这里对我来说并不十分确信。然而,支持创新、让城市变得更易接近,推动新的机遇,加上更好的获取内部信息渠道等承诺,都是行之有效的方法。从实用主义的角度来说,我对能够迎合任何一个特定原因的决策都感到欣慰。再理想主义一点,我发现很多官员对此立场不安而且将此趋势视为是“炒作”。

通过采用开放数据平台来创造一个自身开放的政府有时候会令人困惑,但其实这没有那么费解——仅仅是开放数据并不足以产生开放政府。

下面这条消息来自2013年4月2日Alameda县政府的推特账号(@ACData),可以举例说明在实际中的逻辑缺陷:

推理的路线就是:我们给你部分(极好的)数据,我们想要你往里面填充点东西(很好,谢谢)。所以现在我们就拥有了一个(不算是)开放的政府。

澄清一些角色在这里十分重要,尝试开放数据的员工及参与其中的市民实际上已经朝着一个包含真正的开放政府前进。然而,在我们当地的政府中依然存在捣乱分子,正因为欺诈、管理不当或贪污腐败,以及对公众瞒报而接受调查。大量不存在争议的开放数据是垂手可得的重要果实,但这只是通往开放和责任制政府的一小部分。能够耗费最少的投入而产生良好的宣传效果虽然是一个很棒的开始,不过如果我们听任像政府所形容的,这项工程的寓意在于“我们现在开放了所以交给我们就好”,那么我们就与他们犯了类似的错误:未能真正理解开放数据的意义在哪儿。

开放数据并不是所有工作的最后一项,不过是其中一项重要环节—这给像奥克兰以及许多其他的城市上了一课。现在,奥克兰可以驾轻就熟而需要通过强有力的政策保障开放数据的呼声高涨。在这个过程中,我们通过让民选官员们保持更多的参与而避免了有实际操作而缺乏政策的处境—这跟几乎每一个其他操作开放数据的城市正好相反。我们的风险在于,一旦高级市政官员不喜欢将一些内容公开,那么这个计划便告终。就像起初登载过后来却又删除的市政厅员工的工资数据一样,当时在该市早些时候的数据界面上出现了’随后发布‘(这显然是一个虚假陈述因为事实上数据已被删除)的字眼。不过,同样的数据在州主计长的网站上仍然可见。

数据驱动型城市的万能对策

任何公司或政府实施一条新的政策,推出一项新的服务或作出一项新的投资决策,难以想象其中缺少战略性的使用数据体现他们的想法和规划。但在多数情况下,城市中没有身兼相应技能和授权的员工可以完整分析公共及机密数据。而身处私营部门的我们,往往在看到为市议员作出决策时提供支援是何类信息类型的时候感到恐慌。近两年里涌现出的全球数据占了90%,我们没有任何理由不选择可靠的数据支撑规划和政策制定—这是我们梦寐以求的未来,几乎任何事件中的数据都随时可得而且便于分析,只是我们还没有实现。

奥克兰和Alameda县开放数据时,在有关数据的质量和可靠性方面产生了大量的问题且存在正当理由—这是对于官僚主义的正常恐惧,但这种恐惧在我们的政府里恐怕并不合理。假如我们的原始数据就不理想,那么我们的决策就会是误传。因此,开放数据在某些方面成为我们的当地政府中数据质量控制的开端。公开能让很多瑕疵暴露在阳光底下,而开放数据就暴露了我们在数据的收集、管理和用在城市管理方面存在诸多弊病。尽管认识到这些可能让部分人在一段时间里感到不悦,但那些一直为了在各自的部门中缺乏时间和经费来妥善管理数据而感到惋惜的工作人员,如今已经拥有了跨部门的盟友,这些盟友同样对在数据管理中缺乏重视而表示关注。

这种现象以往只可能发生在少数和政府紧密联系的“专家”群体身上,这些群体通常会因为担心因此失去支持和收入来源而不会对政府施以强有力的推动。现在,我们通过开放数据可以在更大范围内动用到那些对数据表示关注的市民,而且,我们还能从他们身上学到如何改进开放的过程和实际操作—这将使公共数据的内部使用者和更大范围内的民众都受益。

围绕政府数据那些看得见的问题往往结果很令人难堪,但必须看作是我们从不能熟练运用政府数据转变为数据驱动的决策范本这一成长过程中的阵痛。

怎么利用一个拖泥带水的政府

在奥克兰,众多批评者都表示开放数据什么现象也不能解释,什么问题也没有弄清楚,也没有答案可以提供。其中部分还表示,我们的群体对开放数据和开放政府的关注过于集中在技术的解决方案主义上。第一类的批评勉强称得上是合理的,而第二类则是没有完全理解开放运动及其意图。我们可以看一下政府中的现行操作之后再来想想开放数据对未来意味着什么。

在《开放政府》(2010年)中,大卫·伊夫斯[5] 用一个极具说服力的故事很微妙的描述了在信息时代,市民对一个不公开透明的政府决策的态度如何转变:

市民们曾经一度非常信任客观的专业人士和民选官员代表我们作出决策,也能够容忍这个系统中存在不公开不透明,因为它能够带来专业的服务和效率—但是现在情况不再是这样。互联网加速打破了客观性,并不再只是顺从。我们并不是不愿意去相信,而仅仅是希望去证实一下。(伊夫斯,2010年)

他继续比较了一下维基百科(Wikipedia)和大英百科全书(Britannica),事实上,越是透明的权威越值得信赖。伊夫斯认定,“透明是新的客观性所在,如果我们看不到一项决策是如何产生的讨论过程,就不会相信它是客观的。”

在奥克兰,开放数据本可以避免该市陷入一项新的打击犯罪战略失败而导致的尴尬处境。同时,还可以激发一个更为深思熟虑的过程,来为这一事项建立更为全面的方法。而不是成为一个由闭门造车的会议产生的失败案例。

在2012年,奥克兰市宣布实施一项名为100街区计划(100 Blocks Plan)的打击犯罪战略。随后不久,社区、我所在的机构以及许多其他机构都对这项计划严重缺乏具体细节日益担忧。我们全都对发生过90%罪案的街区的具体位置感到困惑,市政府的工作人员仔细看了我们最初的分析。根据我们在分析中显示出来的实际情况,与该市对这项计划的部署存在很大差异。他们在会面时却信心满满的告诉我们,他们的数据和我们的一样—显然,实际情况不是这样。在一项以所在地位置为准的战略中,奥克兰选择了不发布精确信息,并且拒绝发布足以影响这座城市安全和福利的重大决策制订的有关数据。

到了这个时候,犯罪报告中几乎还是开放数据。Michal Migurski 已收集了数年有关犯罪地点的数据,而城市战略委员会清理并发布了更多这类数据。在一座拥有大量分析和预付犯罪经验丰富的机构的城市中,官方的答复却完全不符合我们对一个开明政府的构想,因为这个模型看起来错得离谱而且决策过程遮遮掩掩。我们认为他们没有很好的让有能力对指定和计划公众决策的市民和专业人士发挥作用。

在2012年6月,我们发布了自己完成的奥克兰犯罪热点研究。我们的研究表明,一百个城市街区(加上一个缓冲地带)中,只有70%的暴力犯罪率—而不是该市所发布的90%。当其他城市向公众发布原始数据加上有力的分析帮助我们理解其中过程的时候,奥克兰却在做相反的事情,这让我们感到沮丧。所以我们尝试以身作则发布自己的研究,包括计算中所使用的原始数据,以及详细的研究方法,这样其他人(2012年的城市战略委员会)就可以对结果进行审查并且当我们犯了严重错误的时候加以纠正(况且我们并没有)。

奥克兰市长Quan曾向传媒表示,在这个过程中她有所失误并且本该检查更多数据。我相信从这一声明可以体现她犯了错误。一个城市市长的职能远远不止是对手头上的每一项单独研究或者计数进行独立审查,而任何民选官员都要能够信赖市政官员和其他专家的分析质量。开放数据集开创了一个公民范畴的专家可以轻而易举的为政府决策,分析和声明提供有力见解的未来。这种民主制度才能支持公民在决策中发挥积极的作用。

我早前曾建议,发布原始数据本身并不能打造一个开诚布公和专业的社群,因为它不等同于想要的随手可得的答案,开放数据能促成我们的社区对真正关注的问题达到更深远广泛的参与。就像Aaron Swartz在《开放政府(2010年)》所提出的,透明化的努力本身对政府的现有形式而言并不奏效。开放数据的潜力在于让政策和政府行为能更灵活应变和具有更全面的视野。较为理想一点,未来它将使政府官员的工作平台不再有看不见的角落,也不再受拒绝对公众开放的壁垒所屏蔽。与此不同的是,它将创造一个成百上千或成千上万的选民都可以获取数据并对数据的目的和手段提出疑问加以解释的事实。

后来数据为我做了哪些事?

凭借一时头脑发热开始着手建立“创新型”和“改变游戏规则”的公民应用程序时,我相信我们正在缓慢但是稳步向一个尚未发现的宝藏迈进。在寻找通往这一宝藏的路途上,开放数据将可以真正的做一些有用的事—我指的有用就是解决现有问题,发现未知问题,并且帮助老问题找到新的解决方案。我喜欢这些网络程序能让我原本就舒适生活变得更好,与外界联系更紧密,获得消息也更灵通了。但实际上这仅仅是因为当我们授予了新的技术和数据让其发挥威力。数据已经可以做得如此之多,而我们正在目睹这一趋势向全面和全球范围内发展。

在我们的案例里面,这数十年间有一些团体包括DataKind、GAFFTA和Geeks Without Borders,以及一些类似城市战略委员会(Urban Strategies Council)这样的当地研究和行动组织都在这方面表现优异。以往的传统模式看起来像是:定义问题—identify data to inform the problem/solution—获取并分析数据—传达结果和解决方案。而开放数据则不受这种固有的模式限制,并摆脱了获取数据元素的专属性,能够提供无限的解决方案。我相信,像我们这类以研究为目的,能够获取原始的、记录敏感数据的结构精密的数据库会在未来形成需求。但开放数据听起来就像是数据存储的关卡或者托管模型遇到的死结,非盈利和学术机构也不得不认识到我们都犯了囤积数据的错误,因为我们每个人都可以在任何可能的时候从公共领域着手开始开放数据。

在很多城市研究和空间分析的项目中,数据采集可能就占了高达20%的研究预算。在奥克兰工作的短短几个月里,我们通过从该市和Alameda县取得的部分开放数据,就已经在两个主要项目上节省了几十个小时,对一个社区来说总共节约了不少成本。尤其在本例中,研究者们都是按合约为政府工作(非正式公职人员)。

用已经开放的数据做事有别于典型的工作模式,我们不得不为了在查找和发现其原有数据来进行分析所耗费的时间而向当地政府要价。假如我们必须要汇总原有的数据,就应当将其默认开放。否则,我们自己就在限制这些属于公众的宝贵数据未能公开。非盈利和学术机构本质上通常和政府一样具有保护性且保守封闭,而作为纳税人出资实体,又由于缺乏公共授权而增加了障碍。不过,已经出现了向世界开放他们的数据的基金会(DonorsChoose.org就是一个很好的例子),这些是令人觉得前景有望的范本。

在城市战略委员会里,我们对全部现有的跟接收到的数据一贯采纳“默认开放”的政策并且成为了全国性的样本。但由于大部分的非盈利组织严重缺乏数据和一般性运营、管理以及刊发数据的技术能力,这方面的进展十分缓慢。当真正做到“默认开放”的时候(一定会做到),我们将会看到两项重大结果,而这些结果对社会层面尤其意义重大:一来在一向甚不透明的部门中有更多的透明化出现(遗憾的是Carl Malamud在上世纪九十年代所出版的振奋人心的著作中并没有提到如何量化开放项目的质量或效率),二来大量的数据资源因为解封而产生为人所熟知的裨益。

非盈利机构、基金会和大学在美国进行大量的社区调查,但由于调查结果未能公开和受保护限制而导致许多未知的重复。在很多社区中,过度调查的结果和本不必要的工作应该在一开始就和最终的报告一道将原始的调查结果默认公布。

在目前的情况下,赞助人会收到受资助研究者提供的影响力报告,内称“y项服务需要x个人力完成”,却鲜有提及这些人力用在了什么地方,会有怎样长远的后果和影响,而仅仅展示了通过提供服务产生的收效。授权或鼓励大大小小不同规模的非盈利机构开始开放详细(非机密)的数据能够让赞助人开始评估真正的影响,通过纵观全局而准确找出实际的服务过程中有什么不足,使他们可以从宏观层面上评估调查结果,有助于在将来作出拨款的优先定位。如果你现在还相信这是慈善事业中的惯例的话,就大错特错了。促成政府开放公费数据的各种理由都将不可避免的在社区发展和社会领域掀起同样的趋势,我们将要求透明高于简单的好意和华丽的口号,而且我们将力争以实例为基础的实践,而非“理所当然做有用的事”。

深入险境

需要注意的是,我们这些在数据行业必须认真工作因为涉及竞相开放的数据标准。很多组织曾要求使用保密协议和谅解备忘,但在我们在线就可以找到所需数据而言已经没有意义。不过,近来出现了一些很微妙的中间地带,就是曾经向我们提供详尽而敏感的数据作为研究用途的一些机构,正在开始公开发布一些数据,与此同时,他们通过公开记录法案(PRA) 或信息自由法案(FOIA)开发应对更好的数据处理要求。这就造成开放数据和机密数据之间的界限变得模糊,并且要求非常小心控制的沟通权限。

我们当地的警察部门最近向我们提供了一份我们这些已经取得过的详尽的凶杀案调查数据库,不过这次,他们要求PRA。我们认为通过PRA提供的全部记录都是公开的,并可以重复发布—事实却证明这个推测不完全正确。

出于我们是社区研究的合作伙伴的互信关系,该部门仅仅提供过一次数据。但事实上,他们并不认为这属于不便公开的敏感数据。不过,为了应对开放数据和新订开放记录法案程序,他们确实发布了数据作为对开放记录法案的回应,也就是从技术上发布数据作为公开化记录。这说明有必要仔细并有计划地在各部门内部的敏感资料中审查获取数据的程序。开放数据提供了一个极佳的契机,使你可以将手头持有的数据、法律信息的实用性和单元数据分别进行完整的归档。为了避免在过程和假定的进入权限中出现困惑,这一类型的注意事项很有必要。而且在这种情况下,采用和学校分区类似的获取研究协议可能有其必要性,可以确保新订开放记录法案和敏感性数据不被不恰当地披露。

社区发展

在美国的城市中,社区发展是很少受到开放数据影响的重要部门。这一领域里包括当地政府部门(通常规模较小)和当地非盈利组织(通常为社区发展企业)。这两类组织都深受缺乏有关所在社区权益的细微数据所累,这些数据通常是房地产数据、市场走势、发展、止赎及其他部门数据。目前,大多数这些数据封闭归政府保管或以高价出售给其他政府部门,除非本身就是开放的数据。成本有限、可用性不明确,数据质量和所用币种的混乱,以及大多数房地产数据的相关性等的障碍意味着很多社区发展企业无法凭借数据进行经营。我们采访过许多当地这一领域的组织并且发现几乎每个都面临上述障碍在影响着他们发挥效用和影响力。

由于社区发展在全国范围内所牵动的投资数额巨大,这个部门必须由数据推动。在私立部门中,少有可以在没有可靠数据的情况作出有关何地、何时及以何种方式投资的决策,可是在社区发展企业中却司空见惯。开放关键性房地产及经济发展数据将为社区发展企业提升成熟性和精密度,意义重大。不过,分析和运用这种数据的技能或者低价工具却不是与生俱来的。随着出资人和政府越来越多的关注从实例出发并由数据驱动的工作,政府部门和社区发展机构的投资来源必须承担起他们支持或者提供这方面能力的角色。

你的数据在谁手里?

开放房地产数据将带来有关开放房地产数据的公共所有权之争。目前,在Alameda县,任何非盈利机构或任何城市/县级部门如果想考量止赎情况的影响或评估一下已经出现的止赎影响或机率,就必须从私人渠道(几乎是逐个单独地)购买这些数据。开放部分数据会促使我们追问其他数据未能开放的幕后有什么样的事实。在这个例子中,数据来源为一个县级机构:the Clerk Recorder.  Clerk Recorder 的指令简单,且不会随着时间发生重大变动。满足止赎权的房屋,会建立书面形式。日期、银行或拍卖机构,以及房屋业主的信息将通过电子化记录。而其他关键性细节,包括交易金额、地址、所在城市等则记录在扫描图片上。有业权的公司可以取得这些图片,这些公司提供生成数字化记录等一次性增值服务,并随后出售予任何需要这些数据的政府或公共部门。在2013年,一个好的政府是不会接受这种服务的。

这不是Clerk Recorder的硬伤,从我们与它直接的互动来看,它更像是一个真诚伸出援手的人。问题在于我们如何看待资产和资源,以及政府在机遇出现时缺乏应变上。随着人们期望的提高和政府应当在其可能的地方创造更多价值,这些划定界限的企业数据在更广泛的开放公共数据面前将没有存在的意义,其中,最简单的方法之一就是创造更多的有用的数据。你能想象无法回答例如“您认为今年奥克兰市出现多少止赎是可以接受的呢?”这类简单的问题吗?因为机构本身没有留下有关数据,就无法直接问答这样的问题。

你会为了业务而开放吗?

在得益于社区发展带来的成果外,意义更为重大的在于通过经济发展所得。这在现实中显而易见,但我们总在车轮碾过诸如奥克兰这样的城市时打了瞌睡。我们的城市对投资和零售极为渴求,但我们却未能构建一条坦途并帮助那些为城市设想的人们做出更开明的决策。对大型团体而言,获得本地数据可能减少投资壁垒因为他们拥有专业的市场分析师、经纪人等。但对中小型企业而言,这些服务多数遥不可及。

对奥克兰而言,开放数据同时鼓励开发基于数据的工具应当是一件省心省力的事。到了2013年1月,在我们的城市中,可能从事新业务的负责人或投资者们还无法在线找到能让他们查阅商业执照、建筑和开发许可、空置物业、贫民窟或是地区犯罪率对比等数据或工具。相比之下,在与我们相邻的旧金山市,想取得这些数据全都轻而易举—因为这些数据存在需求并且有助于让开办新的业务变得更为顺畅。对当地政府部门来说,时间总是很紧迫,而这与过往数年类似,所以我们必须更巧妙应对。发布所有的数据有点取巧但至关重要,如果我们的城市因为资金受限或是信息技术过时而未能建立数据工具来吸引业务,那么数据相对于边际成本而言将非常充分,而其他人可以建立低成本和更快地开发出数据工具。那些声称开放数据过于昂贵而办不到的老生常谈已经不再有的放矢,这个改变会引导我们发现城市内部存在的缺陷,并使得吸引更为广泛的社区参与发展工具及分析数据成为可能。由此证明一个拖泥带水的政府的潜力将会令人难以置信,而开放政府将如何一起做更多的事。

结束语

每个城市都会采取不同的路径去开放其数据,通往开放的政府。凭借数据平台和数据中不断提高的参与度,奥克兰起步缓慢,但进展令人惊喜。不过,这座城市是否可以通过推动立法来保障并延续市政府工作人员现时来之不易的努力成果还尚未可知。我们所获得的教训是,民选官员的参与度必须维持在一个较高的水准,这样可以确保政策能够符合实际,也有利于找到强有力的解决方案,这对于避免计划打折扣和在不确定中缓慢爬行至关重要。

越来越有目共睹的是,开放数据将会是满足透明化支持者们的唯一解决答案。这取决于我们当中能更了解开放数据还缺点什么的人,说出真相,开放数据到底是什么和不是什么。这需要有赖于民选官员们比技术上的开创者们付出更多的组织方面的努力和社区保持更为紧密的联系。开放数据更多地为我们所有人提供了一个强有力的助推剂,通过开放数据得以展示开放政府可以真正变得更为有效和灵活。不过接下来更多的是向外界人士展示了开放数据并鼓励政府更广泛地加入开放数据。

得以使用新的开放数据对开发程序而言格外有吸引力,因为它将为社区发展、社会服务以及土地管理部门在效率、决策以及土地管理部门带来令人难以置信的效率,而影响尤其重要。软件开发者们现在(而并非一时)关注的是,随着这项运动的范围波及同样倚赖数据的分析师、策划师及研究学者,开放数据将日趋成熟。很快地,在后一种形势下,将有更多的人将体验到当应对一项错综复杂的研究数据需求时,可以得到的答复是“你当然可以获得数据,因为它已经免费在线开放了!”—这等愉悦。我们都可以促其成事,使开放数据成为一个产生价值并向所有人分享其裨益的广阔平台!

我已经横跨美国数十个城市并在其他地方也工作过,这数十年来,问题始终在于:我们无法取得所需的政府数据或者需要付出高昂代价。而今有太多的城市在这方面已经建立了不成文的规则,只要我们能让城市默认为开放状态(商业开放、参与度公开并且开放创新机制),就能创造更多的价值。

作者附注

完成本文后,奥克兰市就出现了积极的进展。应议会成员Libby Schaaf的请求,我们开始为了在奥克兰市制订新的开放数据方面的法规而广泛征求意见。我们结合了我们从德克萨斯州的奥斯丁,俄勒冈州的波特兰,北卡罗兰纳州的罗利以及芝加哥等地最强有力和相关的元素。

我们发布了起草的报告开放给公众评论,截至目前,已从这些城市的实务工作者那里收到了非常重要的反馈,而且当地人也乐于为此。这只是一次有趣的试验,接下来我们将举办一次圆桌研讨会,回顾并考虑哪些反馈对我们的城市有意义。之后,我们就要尽全力促成此事了,拭目以待吧!

—史蒂夫·斯派克

关于作者

史蒂夫•斯派克(Steve Spiker)在城市战略委员会担任研究及科技部门主管,该委员会在将近26年来均是奥克兰市的一个非盈利社会性变革机构,支持创新与合作。作为该委员会的研究、空间分析、评估和技术工作方面的领导者,斯派克亦担任OpenOakland(一间民营创新机构,支持东岸开放数据和开放政府)的执行董事和联合创办人。

参考文献

Eaves, D. (2010年). Open Government. https://github.com/oreillymedia/open_government

《纽约时报(2012年) The 45 Places to Go in 2012.》(2012年1月6日期)。摘自http://travel.nytimes.com/2012/01/08/travel/45-places-to-go-in-2012.html?pagewanted=all&_r=0

Swartz, A.(2012年9月25日) Fix the machine, not the person.

摘自http://www.aaronsw.com/weblog/nummi

城市战略委员会(2012年6月5日)  Our Take on Oakland's 100 Blocks Plan. 摘自http://www.infoalamedacounty.org/index.php/research/crimesafety/violenceprevention/oakland100blocks.html

城市战略委员会(2012年5月22日) Our Method: Oakland’s 100 Blocks Plan. 摘自http://www.infoalamedacounty.org/index.php/research/crimesafety/violenceprevention/oakland100blocksmethod.html

译者注:

 [1] “铁锈”带(重工业衰退地区,指美国中西部和东北部工业衰退地区)

[2]美国城市中产阶级白人为了逃避废除种族隔离的影响而向市郊的迁徙

[3]极客:

[4]Socrata:

[5] 大卫·伊夫斯:加拿大公开政府维权者