向公众展示数据
要向公众展示数据信息,可采用多种方法。例如,从发布带有新闻故事的原始数据,到创建漂亮的可视化和交互网络应用。我们就“怎样向公众展示数据”请教了开拓前沿的数据新闻记者。
可视化?不可视化?
与文字和图片相比,有些时候数据能更好地讲述故事。这就是为什么``新闻应用'、``数据可视化'这些术语近来成为许多新闻编辑部的热门词语的原因。同时,此般热情也促使了新工具和新技术的涌现(大多是免费的),它们的设计初衷就是帮助技术上一窍不通的记者将数据转换成视觉化的叙事。
像Google Fusion Tables、Many Eyes、Tableau、Dipity等等这样的工具使得创建地图、图表、图形甚至是以往只属于专业领域的那些非常成熟数据应用,都变得更为简单。然而,要说当下的难点,记者们面临的问题不是你是否有能力将数据集转化为可视化作品,而是你是否有必要这么做。在许多方面来说,数据可视化宁缺毋滥。
— 阿隆·菲尔霍夫(Aron Pilhofer),纽约时报
运用运动图形(Motion Graphics)
有了严密的脚本、适时的动画、清晰的解释,Motion Graphics可以使复杂的数字或想法生动起来,从而指引你的受众穿梭于故事中。汉斯·罗斯林的视频讲座便是一个很好的例子,他告诉我们如何能让数据在屏幕上生动地讲述一个故事。不论你认同与否,我认为《经济学人》的扔鞋指数也是一个不错的例子,它用视频讲述了一个基于数字的故事。你不会也不该将这里的图像视作静态图像,那或许仅仅是个开始。一旦你一步步地构建这种图像,就会理解“扔鞋指数”是如何又为何被做出来的。有了动态图像和动画短片,你可以让你的受众对旁白所叙述的事印象更深刻,同时,解释性的视觉传达也提供了强有力的、令人难忘的讲故事方法。
— 露露·平尼(Lulu Pinney),自由信息图设计师
告诉全世界
我们的工作流程大多以Excel作为开始。假如数据中包含有趣的信息,我们就能以此快速地完成工作。倘若我们认为数据中包含特殊的信息,我们就会去采编部。庆幸的是,我们就位于《卫报》主要采编部的旁边。然后,我们会思考怎样将数据进行可视化或者呈现在舞台上。我们会写一个与之相关的帖子。写帖子时,我总是拿一份从文本编辑器得到的缩略版电子数据表,做一些分析,以便挑出有趣的事。接着,我发表帖子,并花些时间在推特上进行推广,我会将它发给不同的人,以便它的链接能够出现在所有适宜的地方。
博文的浏览量有一半来自Twitter和Facebook。人们浏览数据博客Datablog的文章,平均耗时6分钟,而浏览《卫报》的其他网站平均耗时仅为1分钟,对此我们很自豪。6分钟是一个极品数字,是花费在每一页上的最佳时间,是分析浏览量时一项重要的指标。
这一事实也让我们的同事相信我们所做的事很有价值。编辑部每个人都知道,我们一直致力于挖掘具有数据导向的大事件,例如计算机和信息科学会议、维基解密、英国骚乱。在计算机和信息科学会议事件中,我们《卫报》有五、六名专业报道员,专门负责在英国政府发布数据后发表自己的观点。我们还有一支与此相似的小组,我们还有一个5-6人的小组,成员包括像波利•柯蒂斯这样的著名报道员。每当英国政府的支出超过25000英镑时,他们就会发表数据。维基解密显然也是一件大事,涉及了很多有关伊拉克和阿富汗的报道。英国骚乱也是如此,短短两天就有55万点击量。
然而,我们并不是只着眼于短期的点击量,我们还要成为有用信息的可靠来源。我们试图做到这一点:只要某个话题在我们的报道范围之内,你就可以获得相关的、高质量、有意义的信息。
— 西蒙·罗杰斯(Simon Rogers),卫报
发布数据
我们经常将数据以可视化或方便下载的方式嵌入网站。我们的读者可以通过可视化互动或其他数据使用方式来探寻一个故事的背后发生了什么。这件事重要的原因是它增进了《西雅图时报》的透明性。我们展示给用户的数据也使我们得到强有力的结论。使用者的队伍中,肯定有评论家,还有那些对故事及其细节感兴趣的人。使用数据后,我们从他们那里获得关于我们曾错过的以及我们可以探索的事物的窍门——这对于新闻学的重要追求都是很有价值的。
— 谢丽尔·菲利普斯(Cheryl Phillips),西雅图时报
开放你的数据
使新闻用户方便地获得我们用在工作上的数据是有必要的,原因如下:读者可以确信我们并没有为了得到不公正的结论而践踏数据;开放数据符合社会科学的传统,它让研究人员能够重复我们的工作;鼓励读者学习数据可以激发他们总结出找到后续报道的窍门;最后,一旦读者对你的数据产生了兴趣,他很可能成为你的忠实读者。
— 史蒂夫·多伊格(Steve Doig),沃尔特·克朗凯特新闻学院, 亚利桑那州立大学
开设开放数据平台
在《国家报》,发布开放的数据是数据新闻工作者活动的一个重要组成部分。阿根廷既没有自由信息法案,也没有国家级数据门户网站,因此,我们对于给予读者权利、让他们接触到我们在报道中使用的数据这件事特别重视。
此外,我们在《民族报》的数据博客中展示了某些数据集和可视化效果。这么做的目的是在阿根廷宣传数据与数据发布工具,向他人展示我们是如何收集并使用数据的、而其它人又是如何对于这些数据进行再利用的。
在2012年2月,我们开设了这一平台,此后,我们收到了许多关于数据集的意见和建议,它们大多来自学术研究人员和大学生。每次我们回复了解决方案或特殊数据集时,学生们都表示感激。人们通过公告栏了解、评价我们的数据,我们曾多次成为此项服务的评论及浏览热门。2011年,我们在浏览次数前100名的可视化中排名第七
— 安赫利卡·佩拉塔·拉莫斯(Angélica Peralta Ramos), 国家报 (阿根廷)
让数据变的人性化
当人们对海量数据的讨论突然进入到更广阔的层面时,一个重要的部分——人为因素——显然被忽视了。很多人将数据视作分离的、独立的数字,但它们实际上是对有形的(人性化的)事物的一种测量。数据与真实人类的真实生活绑在一起,当我们了解数字时,我们必须考虑产生数字的现实系统。
例如,现如今有数以亿计的电话及移动设备正在收集着定位数据。我们很容易将它们(代表经纬、时间的数字)视作“数字消耗”,然而正是他们才把我们中生活的点点滴滴串联起来。人们读电子数据表时,可能会觉得那是客观却乏味的,但是如果人们可以将他们自己的事情展示出来并进行重新演绎,他们就会觉得自己的记忆被重新激活了。这样的体验是非常鲜活并且人性的。
如今,许多“第三方” ——应用开发者、大品牌公司以及广告商——正在使用定位数据。“乙方”(电信及设备管理器)拥有数据,而“甲方”(你自己)既接触不到也不能控制这一信息。在《纽约时报》研发组里,我们发布了一个叫OpenPaths的原型设计,为的是让公众探索自己的定位数据,同时让他们体会数据所有权的概念。毕竟,人们应该控制这些数据,因为它们与人们的生活和经历紧密相连。
在揭示数据内在的人性化这一点上,新闻工作者扮演了重要的角色。通过这种做法,他们有能力改变公众对数据以及对数字产生系统的理解¬。
— 杰·索普(Jer Thorp),常驻《纽约时报》研发组的数据艺术家
开放数据,开源,开放新闻
2012年很可能是开放新闻的一年,它位于编辑学理念的中心,是当前品牌化的关键信息。在这一年,我们需要一个过程来开放以数据为导向的新闻学,这是不言自明的。这一过程不仅需要开放数据的支持,而且要启用开放的工具。到今年年底,我们希望自己发布的每个可视化信息都能附上其背后的原始数据和推动代码。
如今用在可视化信息上的许多工具都还不是开源的。还有一些是有限制性许可证,禁止人们使用其衍生数据。现存的开源库可以很好地解决单一问题,但是无法提供更多的解决方法。综上所述,如今的环境还是相对封闭的,人们很难去相互协作。为此,我们正在为交互式叙述开发一系列的开源工具,即Miso Project系列(@themisoproject)。
就这一产品,我们与许多其他的新闻性组织进行了讨论。它采取社区参与的办法,挖掘了开源软件的全部潜能。如果我们获得成功,我们将为读者打开一个完全不同以往的局面。其贡献可以超越对产品分流、缺陷修复或者以意想不到的方式实现数据再利用。
— 阿拉斯泰尔·丹特(Alastair Dant),卫报
添加下载链接
过去的几年内,我做过一些GB级别的数据项目或数据新闻,上至20世纪60年代出现的打字机文稿,下至维基解密发布的1.5G的密电。说服编辑以一个开放的、可读的格式去系统地发布源数据始终是非常难的。为了回避这个问题,我在文章中添加了“数据下载”的链接,点击后便可找到包含该文件的文献或者是相关的谷歌文档。尽管来自对数据再利用的读者的关注与我们在政府赞助计划中估计的一致(很低很低)。然而,确实没有几个数据再利用的例子能做到提供新见解、刺激新对话,让人觉得他们值得在每个项目上多花费几分钟!
— 尼古拉斯·凯瑟-布瑞尔(Nicolas Kayser-Bril),Journalism++
了解你的能力范围
你需要了解你的能力范围。为了找乐子而侵入他人的系统和为了扩大规模、提高性能而进行设计是两回事。你务必要与人合作,因为他们有你的设计所需要的技能。不要忘记设计环节,毕竟,可用性、用户体验和呈现方式会大大影响设计的成败。
— 克里斯·吴(Chrys Wu), Hacks/Hackers