说起开放数据这一话题,讨论的焦点往往集中在政策、政治、社会治理等问题上。这些的确是良好且必要的出发点和落脚点,但是在此过程中还有两个重要的问题:我们如何产生开放数据?以及我们如何推动数据开放成为政府流程中的一个部分?
如今,地方政府、各州及联邦政府往往不得不“多走一公里”,来把那些“开放记录”转换成我们所认可的“开放数据”。这基本上意味着,开放记录是以一种便利的、自动化的和自助的格式而呈现。
“多走一公里”着实困难重重。然而,尽管开放数据这项创新有种种好处,但它仍会在推进过程中产生一些问题,这使得反对者可以据此轻而易举地颠覆开放数据行动的成果——想想社交媒体的好处和脸谱网瘾症之间的争论就不难理解了。
例如,立法者在通过开放记录相关法律时可能没有充分地考虑到,这些记录对于任何一名数据请求者而言,都将变得唾手可得。将一份手枪许可持有者名单公布于众合理吗?在我所居住的北卡罗莱纳州,公开记录相关法律似乎默认了这一行为的合法性。然而,当一名当地记者打算公布这份名单而根据法律向治安官索取时则举步维艰。
那么,沿袭已久的往往让政府官员紧张的年度薪酬见报公开制又是否合理呢?设想,如果各个行业都向所有雇员实时公布薪酬。一些人必定不再问“为什么珍妮一个月比我多一千美金”之类的问题了。
变革往往是艰难的。IT和创新界的人对此感受尤深。那些有关变革的开创性著作——无论是奇普·希思和丹·希思的《瞬变:如何让你的世界变好一些》或约翰·P·科特的《引领变革》——对开放数据行动所付诸的笔墨都毫不逊于其他创新。
在我所工作的北卡罗莱纳州阿什维尔市,为了建立有利于变革的良好环境,在不同群体中树立必须改变的理念是其中的关键战略。尽管开放数据的大量涌现可能会产生潜在的新问题,但是缺乏开放数据所带来的问题也不容小觑。
北卡罗莱纳州各市都必须根据一般性法规的第132章,对开放记录请求予以回应。公民、企业家和记者可能都想获得政府记录,但是传统流程让每个人都痛苦不堪。以下是典型的处理流程:
1.请求者向政府某部门提交请求。为具体说明,我们这里指请求企业营业执照数据,所以请求者与城市财政部门联系。
2.为了使请求得以追踪和跟进,财政部门应当联系公共信息办公室(PIO)。因为在许多城市里发现这种现象:当相关部门自行处理请求时,就可能出现“掉链子”的情况——所以,PIO类似于现代的IT帮助台,其职责就是追踪服务请求处理。因此,在本例中,我们假设财政部门工作人员一刻未耽误且准确无误将请求转发给公共信息办公室。当然,这个假设仅是理想状况,现实未必如此。
3.IT或政府相关部门拉出被请求的数据。
4.城市的法律职能部门审查数据,以确保发布此数据不违反任何法律。如果某些数据属于机密信息、商业秘密、州政府官员信息,或其他法律规定的非公开数据,他们会让IT必须删节这些数据。
5.IT将处理后的最终数据产品递给PIO,PIO则将其反馈给请求者。
尽管政府有十足的理由为如此繁琐耗时的审查过程辩解,但我认为至少可以做到,对同一数据集不重复审查,并且该数据对未来请求者可以实现自助服务。
这是我们推动开放数据行动所探寻的最实际的好处。
我活跃在阿什维尔市的创业社区,所以我很清楚,对于市区里那些主要业务基于获取政府资料的公司而言,阿什维尔就是他们的家。一个名为BuidFax的公司,在我们社区雇佣了35个人。我曾与该公司的首席技术官做过一定交流,了解到他们曾经历了极度痛苦且成本高昂的过程才把散乱的资料集成到自己的产品线——实质是保险和抵押贷款行业的财产状况分析。要知道他们面对的是一箱箱打印资料,需要被转化为结构化的且机器可读的数据。这个例子生动反映了我们社区里那些想从政府管理的公开数据中创造价值的企业家们可能会面对的问题。
我也亲眼目睹记者们面对记录请求受到拖延时那种无声的愤怒,即使拖延是合法的。
在寻觅新项目投机资金困难的环境下,所有这些情形都会发生。思想实验是这样进行的:“我们是开展一个可能减少工作人员完成记录请求时间的项目,还是应该更换一辆老化的巡逻车? ”正如你的预期,满足紧急安全需求的优先级应该高于IT创新应用,并且也无可厚非。所以,在预算相当紧张的情况下,这些项目是得不到投资的。
但也存在另一个问题:如果数据不向公众开放,就意味着政府IT部门或收费昂贵的供应商必须凡事亲力亲为。“公民黑客”们如果只能攻入他们可以获取的数据,那么他们怎么可能有创新?这些人可以编写出一个与Linux影响力相当的程序,但他们想为政府开发项目,却甚至无从开始。
没有人是赢家。
在这里,如果没有人发出呼声,把这些问题告诉其他人,你可以想象出以下荒谬的场景:记者和其他人向立法者抱怨获取政府数据时遇到的障碍。立法者通过一项繁琐的法律,规定城市有义务公开发布一个有关所有可获取数据的分类目录。记者则会要求获取“一切”,即使法律阻止他们这样获得“一切”(社会安全号码、人事档案、某些执法数据等)。然后,系统供应商声称他们的数据分类法(有时被称为“数据字典” )属于私有和机密的信息。即使供应商根据国家法律签署的合同,但他们还是会要求政府IT人员在访问数据表时签订保密协议。这的确是荒谬且艰难之处。
问题是,在北卡罗莱纳州,这一幕幕竟然经常上演。如果大家彼此之间都对这些问题有所沟通,那么不难想象,当人们需要某些东西时,可以轻而易举地确定需要的到底是什么,并且不同群体将共同努力使他能够获得到。
在我们社区,来自不同组织(一家本地宽带提供商、一个创业团队,本地企业、政府、商会,以及一个IT网络团队)的人群展开了一场头脑风暴式的聚会,在此之后,一个组织者团队成立了,并启动了一个名为开放数据日的讨论会议(opendataday.com)。有关开放数据日的创意是这样的:
·向本地区的公众、记者、商人、民选官员和其他人介绍缺乏开放数据可能带来的问题,将会对开放数据产生巨大推动。
·它将向大家澄清,开放数据不只是政府IT部门或者那些富有公德心的公民的事情。
·来自社区的国民演说家向大家讲演开放数据问题的成功案例将是当日活动的一大特色。
·它将作为我们城市开放数据门户的启动仪式。
·当日活动的另一个特色是组织一场“编码马拉松”,来概念式地证明通过使用开放数据门户中的数据所可能实现的事情。
·最重要的是,它将使开放数据转化为一个社区问题,而不再仅是城市政府的问题。
事实上,我们的确是这样做的。我们邀请了Code for America团队的总监凯文·库里,Open Data Philly的罗伯特·奇塔姆,以及肯塔基州路易斯维尔市“绩效改进”负责人特里萨雷诺·韦伯。我们推出了数据门户。在10个社区赞助商,20名研讨会发言人和130名参与者的共同努力下,这次难忘的活动使彼此间建立了联系,并促成了社区内其他开放数据和编程活动(一群定期聚会的“公民黑客”志愿组成了Code for America团队尤其值得一提)。
我必须强调的是,如果没有我们的社区组织者,这一切都难以实现。因为此次活动的主办方是多样化的,所以它被定位为一次社区活动,而不是一次市政府的活动。这使得活动不仅得到了社区本身的认同,也得到了市政府的认同。(有谁真的愿意来听一个城市的IT部门来高谈阔论?没有人,不是吗? )
许多IT人在与市民互动时感到很不自在。他们把这事丢给了公共信息办公室、市议会或者是居委会。我并不认为这会在社区里达到良好的效果,正如一个市内IT项目不与内部部门有任何交互是做不好的一样。诚然,业务技术服务于直线部门,但最终也是为公众提供服务。一个不与民众进行互动的业务技术主管,却开发出民众欢迎的的技术,这简直是无稽之谈。当然,在一个大型社区,你无法指望能与每个居民互动,所以与居民群进行互动就变得很重要。
我们这次活动的社区组织者来自于居民和商业社群,他们促成了活动,并为活动的宣传和参与率做了贡献。一个特别重要的团队——早于我市Code for America团队成立的——社区创业群Venture Asheville,他们为活动提供了赞助,并使我们取得了技术创业和编程社区的关注和信任。镇上一个名为“相约极客”的IT人网络组织是活动的另一个重要组织者群体。
社区开放数据日实现了以下成果:
·记者们能够坦率地表达他们在获取数据时遇到的挑战。
·减少了地方政府工作人员对数据开放的顾虑,因为他们对数据的使用者有了更深的了解,也更理解了开放数据是利大于弊的。
·大量的地方媒体报道也进一步影响了社区(福布斯,2012)。
·举办了一场成功的编程马拉松,一个通过混聚公交线路和公共艺术馆数据,以引导民众选择参观公共艺术馆的合适公交线路的应用程序脱颖而出。
·推出了一个Code for America团队平台,名为Code for Asheville。
挑战和问题自然仍旧存在。开放数据会揭露意识形态世界里的许多问题,使得政府工作人员仍然担心参与开放数据行动可能被误解为参与政治活动(他们是不允许参加政治活动)。并且,尽管开展了教育活动,但是大家还是会混淆开放记录和开放数据之间的区别。能让记录“开放”是法律而非技术和自动化操作,但这一点并不是每一个利益相关者都能理解。
可持续性
我们的经历证明:“产品发布”是向你所在社区传递问题及解决方案等观点的良好途径。一场轰动之后很容易不了了之,但是无论你如何开启了开放数据行动,此后你都必须为之持续努力。
显然,立即公布所有的数据集是不可持续或不切实际的。如果大家感到政府工作人员,特别是IT部门,武断或任意地发布数据,也就是说让人觉得政府行事不公,那么开放数据行动就会遭到破坏。
鉴于公共信息办公室和IT之间已经形成了天然的伙伴关系,我们针对开放数据的开放标准采用了一个三角叉法。这样可以确保民选官员的政见和政策方针,以及政府工作人员所作的开放选择更加理性,并且我们能很好的利用时间。
语用性
发布一个数据集能否节省工作人员的时间?将一个频繁请求或时间密集的数据集自动化能否减轻公共记录请求处理的负担?这能降低政府成本吗?这能让流程更简单吗?这是否有助于那些服务公众的职能单位(例如,公安、消防或发展服务等等)实现其业务目标?
公开数据目录中的某个数据集是否公开的标准取决于有多少人支持其公开。即使有两个人想公开,也可能无法充分代表社区里85,000名公民社会的意愿。实际上,还没有某个数据集是社区民众强烈支持公开的。但是,当人们明确支持公开某个数据集时,我们将会尽最大努力实现。
政策性
我们的政府管理委员会想要的是什么?如果我们的管委会说要发布的某一数据集尚未达到“语用性”或“参与性”这另外两个标准,那就交给我们来做吧。
我们认为下面这些准则可以帮助工作人员作出决策,同时也不会束缚他们的手脚或是将一切委派给已经非常繁忙的管委会。
语用性的标准相当重要。大多数城市,尤其是那些人口10万以下的城市,它们的资源是有限的。对那些频繁请求的数据创建自助服务,并在此数据基础上为其他人创造机会,单从操作效率的角度来看就很有意义。我们的数据证明,开放数据节省了IT 、司法和PIO部门的时间。我们对开放数据目录的唯一事件进行跟踪(也就是说,如果有人下载相同的数据集两次,我们就不计入),已经看到数量在逐月持续增长。在2013年,我们计算出平均每月对数据目录有144次唯一请求,这似乎看起来不是很多,但我们需要从适当的角度来看待它。按照我们过去处理数据的方式,一般每个人即使不花上几个小时也至少要半个小时,所以等到司法、PIO、相关部门和IT接手这一请求时,大约就要花费相当昂贵和稀缺的两个小时的人工时间——这是最低限度。即使你相当保守估计,假设没有任何司法或相关部门参与,只是占用了IT和PIO最少的处理时间,那也要花掉PIO和IT每个月70个小时左右的时间。
真的吗?要花近两个星期的工作时间?是的,在开放数据之前,我们可能还没有花那么多时间(确实,早前的数据显示平均每月有70个分类请求,意味着如果是花最短时间且是人工操作,大概花一个星期的时间)。尽管如此,我们让数据更加易于获取,人们获取数据时不再会遇到障碍。因此,越来越多的人们来使用数据,但政府不必为此增加工作人员来应对。这也是一个非常重要的成果。
下一步
一旦你启动一个数据门户,激起了大家的兴趣,并建立了对话,我认为正确的做法是后退一点点。这很困难(至少对我而言),因为作为某事的一个内部倡导者,你坚信它,并且你已经为此投入了很多时间和精力。
我要明确指出:这并不是因为将会受到诋毁而退后。任何创新都会受到一定程度的诋毁,而且,可悲的是,误导市民的“你亲自为我工作”综合症正好存在于那些少数有发言权的公众中。开放数据也不例外。你将碰到恶意批评者,而且你不得不应付他们。
更重要的是,即便如此,还是会有其他有创意的人愿意参与其中。
内部性引导不能停止。重要的是,在组织内持续传播开放数据的价值,不断地告诉大家数据开放及自助可以让大家把精力放在更加有意义的事情上,而不是放在人工提取数据上。
而在外部,当你后退一点,为领导者的培养建立一些空间,你便创造了机会。天然的领导者加快出现。在我们社区,一对公务员夫妇在他们工作外志愿为Code for America团队组织活动(这对他们、对社区都有利),十多名非政府组织雇员也帮助我们组织活动、创建代码、安排聚会等等。至少有一名大学教授和一名民选官员进入我市2013年全国公众电脑爱好者活动“为食品破解”的领导层。
“为食品破解”活动呼吁人们解决社区所面对的挑战:学校缺乏健康食品,让缺乏食物的民众吃上健康食品,以及在地区发生危机时确保有充足的食物供应。这次活动的宣传不在开放数据、破解和编码——尽管这些都是有用的工具——而是主要聚焦于社区问题的解决。
组织者选择了社区里那些政府和社区之前已采取过行动的头等大事。例如,阿什维尔市班康县食品政策委员会的任务是“确定和提出创新性解决方案,以改善当地粮食系统,带动地方经济发展,并促进粮食系统环境可持续发展和社会公正。 ”此外,阿什维尔市议会于2013年1月22日通过第13-17号决议,支持市级粮食政策目标,以及围绕这些目标的行动计划。
问题是:无论社区头等大事是什么,聚焦优先事项而非工具本身更能让民众兴奋。如果领导层来自于社区,你可以打赌好事将会发生。
随着社区力量开始崛起,我认为作为开放数据的内部倡导者,其最佳角色应是一个桥梁建立者或诠释者。毕竟,开放数据者倡导者对双方都了解。
例如,不是所有事情都完全符合”语用-参与-政策“原则。如果不符合,一些联系和沟通的工作就颇有裨益。在一个案例中,阿什维尔团队重新部署了一个名为”看厨师“的开源应用,旨在使预算透明化。这的确是一种使预算透明化的应用,雄心勃勃的政府IT人员早已跃跃欲试多年,但因为优先度低于其他需求,而一直没有资金投入。它处于“想做”的象限,而政府IT要把他们大部分时间花在那些“必须做”和“应该做”象限内的事情。问题的关键是,假设这是公众和政府的良好意愿;这是每个人都想要的东西。
这项应用所需的数据并非唾手可得(并且数据集也不是明显符合标准),但是这是开放记录,所以团队视其为开放记录请求。预算部门非常乐意提供数据,但是也对存储于超大财政数据库中的数据可能会关联到公开官方记录而有所顾虑。他们说道了点子上:预算数据总是实时的,而组织结构图却不总能在会计科目表中得以反映。
例如,当你把“运输”从已有的“公共工程”中调整到自己的部门,或者当你将“IT”调出“财政”时,你的组织结构图就突然不再匹配你系统中的财政会计科目表了。这可能需要数周甚至数月,才能完成所有的日记录入和会计表修改。而由于系统的复杂性,通常需要整整一年更新一次的财务系统。为了在预算书中提出了一个正确的财务状况,确保帐户X被包含在Y部门的记账中,大量的工作需要去做。
在这种情况下,就要提供用于建立正式预算书的实际工作文件。
这样用尽办法并没有解决一切问题(尽管应用程序没有得到部署),并且有人可能会不失时机地发出争议之声,认为这会让数据库引起入侵者的兴趣。这个例子很好的证明了,公众和政府工作人员有些不同的语系、不同的观点。他们需要一个理解和同情双方的倡导者。
政府工作人员(一般)并不想试图掩饰什么。公众(一般)也不是要与工作人员玩“抓到你”的游戏。政府工作人员(一般)只是优先做领导想做的事情、监管要求做的事情以及他们正在跟进流程。而公众(一般)只是试图问一个简单的问题,并期望得到一个简单的答案。一个懂得一枚硬币两面的开放数据的倡导者,可以帮助创造更多的对话,减少一系列的要求和沉默。
但问题就变成了,为什么流程没有整合开放数据的需要,以及为什么领导们并不认为开放数据是一个好主意?
嗯,我觉得他们有一天会明白。奥巴马总统于2013年5月发布的的公开数据行政命令,对于联邦机构是一个很好的开始。
我们何不从最开始就要求供应商在其建议邀请书(RFP)、报价邀请书(RFQ)中要表明处理“开放数据”请求?或者要求他们提出某种形式的建议,能够很容易地把“由国家法律定义的私有物”从“公共记录”中分离出来?
底线是好的领导层意识到浪费大家花费在删节、审查和重新打包文档和数据的时间实在糟糕。
好的领导层将意识到开放数据的语用意义。
关于作者
乔纳森·菲尔德曼是北加利福利亚州阿什维尔市的首席信息官,他的商业背景和《信息周刊》专栏作家的职业身份使他能用更好的商业技术和流程开发创新应用。阿什维尔市是一个快速发展的时尚城市;它被福多尔公司命名为最佳旅游胜地,也是众多新啤酒制造商的聚集地,例如新比利时公司将其作为东海岸的业务扩展区。在乔纳森的领导期间,这个城市因通过IT创新应用改进公共服务、降低成本而享誉国内外(获得包括国际经济发展委员会新媒体奖,NATOA社区宽带奖、和GMIS最佳实践奖等)。