从数据开始,以故事结尾
为了吸引读者,你得用标题中的数字让读者打起精神并引起他们的注意;即便是不知道背后的数据集,你也应当可以阅读故事;要让故事激动人心,并时刻牢记哪些人是你的读者。
其中一个例子是,新闻调查局(Bureau of Investigative Journalism)实施的一个项目中,使用了欧盟委员会的财务公开系统。那么这个报道也正是来源自我们最初想在数据库中查询的一些数据。
我们利用诸如“鸡尾酒”、“高尔夫”和“假期”等关键词搜索数据。这让我们确定了委员会在这些项目上的花费,并让随后我们提出大量的问题并作报道。
但是通过关键词不是每次都能找到你要的,有时你得坐定思考你真正寻求的东西。项目进行过程中,我们还想得知委员们在私人(喷气式)飞机旅行上的花费,但数据里没有“私人喷气式飞机”这个条目,我们不得不靠其他方法得知他们旅行供应商的名字。一旦我们知道为委员会提供服务的供应商名字叫“Abelag”,我们就能通过查询数据得知由Abelag提供的服务开销是多少了。
通过这个方法,我们在查询数据时就有了定义确切的对象;找到能够支撑标题的数字,以及整个的基调。
另一种方法是从黑名单着手,查找额外项目。从数据中找到故事的简单办法就是知道有哪些东西是数据库中不应该有的。《金融时报》与新闻调查局联合的欧盟结构基金项目对此作出了很好的说明。
委员会自己制定了规则,规定了哪种类型的公司和协会应当被禁止领取结构基金(译者按:Structural Fund,欧盟设立旨在支持落后地区或产业衰退地区的经济发展与产业结构调整的调控基金)。对香烟和烟草生产商的开支是其中一个例子。
以烟草公司、生产商和种植商的名字来查询数据,我们找到数据显示英美烟草集团处于德国的一家工厂接收了150万欧元,这笔资金违反了委员会关于开支的规定——这是从数据中找到故事的快捷办法。
你永远不会知道自己将在数据集里得到什么讯息,所以尽管来看一眼。你需要多一点野心,当你使用筛选工具(最大、极端、最普遍,等等)来确定一些明显的特征时,往往就能有所斩获。
— 克莱恩·巴(Caelainn Barr),Citywire