品玩

科技创新者的每日必读

打开APP
关闭
Facebook

Cambridge Analytica:掩盖在大数据高科技下的竞选作弊器

Facebook 用户信息被窃取并用于操纵选举一事的严重程度,堪比数年前的 NSA 告密事件。

邢逸帆

发布于 2018年3月21日

文/邢逸帆  编辑/光谱

更新:修改了《纽约时报》、《卫报》和 Facebook 声明之间的时间先后顺序以及逻辑。据了解,Facebook 公关在两家报纸的报道刊发之前收到了评论的请求,于是抢先一步发布了关闭 CA、SCL、科根等人账号和接口的声明。随后两家报纸刊发了报道。


 

美剧《纸牌屋》第四季中,安德伍德总统在第二个任期中遭遇共和党候选人威廉·康威 (William Conway) 的强势挑战。

康威英俊潇洒、家庭圆满,出身军事世家,深得选民喜爱。但真正让他赢得民心的秘密武器,并非他的个人魅力,而是他和搜索引擎 “Pollyhop” 之间的暧昧关系。在 Pollyhop 的帮助下,康威的竞选团队挖掘选民数据,对他们的日常行为进行分析,清楚地知道了选民们喜欢什么、想要什么、想听什么,由此进行竞选广告精准投放。康威的正面形象无处不在,每一个政策每一句话都说到选民心坎里,选民主动掏出了选票。

而这几天现实世界中爆发的大新闻,让《纸牌屋》的这段剧情变成了一个极具前瞻性的政治寓言。

2016 年美国总统大选期间,就有这样一家和 Pollyhop 类似的公司。它采用独家的心理统计模型分析用户行为,帮助特朗普竞选团队定制从政治立场到竞选口号的一切,并精准投放数字广告,一定程度上扭转了特朗普的糟糕形象,帮助他赢得了大选。

这家公司来自英国,名叫 Cambridge Analytica。

上述的一切都没毛病,但问题出在了这家公司获取数据的方式上。


 

上周五,Facebook 突然官方宣称,在自家的开放平台上关闭了 CA 和 CA 母公司“战略通讯实验室” (Strategic Communications Lab, 以下简称 SCL) 两家公司的接口,并在全平台上封停这两家机构的账号。

很快,美国的《纽约时报》和英国的《卫报》两家权威媒体同时刊文,曝光了 Cambridge Analytica(以下简称 CA)违规窃取数据的丑闻。两家媒体通过 CA 内部信源获得的证据表明,该公司违反了 Facebook 开放平台协议,获取了总计超过 5000 万名 Facebook 用户(其中大部分为美国真实选民)的数据。

尽管比起泄露了 30 亿账户资料的雅虎, 5000 万真的不算多,但考虑到在 CA 事件中用户的姓名、性别、住址、生活状态、政治主张、社交关系等信息均被获取,足够对一个用户进行完整画像,这一事件足以跻身美国史上最大规模数据泄露榜单。

当一家公司拥有了超过 5000 万个真实个人的数据,和分析这些数据的能力,它的力量足以颠覆一个社会——只要它愿意。

过去,全世界只有一家公司拥有这个能力:Facebook。而现在,多了一家公司:CA。

Facebook 没有这个意愿,而 CA 有。

SCL 官网显示,这家经营已超过 25 年的公司专门面向“政府和军事客户”,向后者提供“数据、分析和策略”等咨询服务;而其子公司 CA,在 2013 年正式独立并专门负责竞选业务。据该公司 CEO 亚历山大·尼克斯 (Alexander Nix) 称,CA 在独立的第二年就已经参与了多达 44 场美国各级竞选。

在美国,CA 主要服务共和党参选人,因其主要股东为共和党最大献金来源之一的罗伯特·墨瑟 (Robert Mercer)。2015 年,墨瑟一度支持共和党参议员泰德·克鲁兹 (Ted Cruz) 竞选总统,于是 CA 开始为克鲁兹服务。后来,墨瑟被美国民粹和孤立主义领军人物史蒂夫·班农 (Steve Bannon) 说服,转而支持依靠民粹路线崭露头角的政坛新人特朗普。次年,CA 加入了特朗普的竞选板子,用心理统计模型辅助竞选中的大小事宜。

2017 年,班农传记《恶魔的交易》(Devil's Bargain) 一书面市,提到班农在近几年开始崇拜互联网的力量,并找寻借由互联网及数据的力量实现政治抱负的手段。书中对 CA 有了不少描述,也让这家公司因此得到更广泛的关注。民调和竞选人士普遍认为,CA 为特朗普的胜选提供了非决定性,但仍十分重要的帮助。

班农得到了他想要的,将这家“数据、分析和策略”咨询公司变成了民粹主义者上位的垫脚石。他一度在 CA 的董事会拥有一个席位。

该公司前核心员工克里斯托佛·怀利 (Christopher Wylie) 在接受《纽约时报》采访时如此评价 CA 的管理者及服务对象:“他们想要在美国掀起一场文化战争,而 CA 是他们的军火库。”

 CA CEO 亚历山大·尼克斯。他的公司只用了数年,在政客中的受欢迎程度就超越了有数十年经验的民调专家
CA CEO 亚历山大·尼克斯。他的公司只用了数年,在政客中的受欢迎程度就超越了有数十年经验的民调专家

该公司使用心理统计模型帮助竞选团队分析选民偏好并不是什么秘密。官网明确说明:我们提供从预测选民行为,到定点推送广告等一系列服务,还有更露骨的:我们会提供数据,帮助用户取得选票,赢得竞选


 

CA 能够如此堂而皇之地说出这样的话,是因为操纵选民本身就是美国竞选政治的一堂必修课。电视时代之前,竞选人都要亲自出马在各个州站台拉票 (stumping) 体恤民情,参选人出席的演讲和市政厅会议的热闹程度不亚于日本爱豆握手会;到了电视时代,除了继续到各州演说,选战也增加了互砸电视广告一项。投放广告的目的要么是稳定自己的支持者,笼络立场接近的选民,要么是打击竞选对手——理论上来说,这都是明目张胆地操纵选民。

从 2012 年开始,选战又增加了选民数据一项。数据一度被认为是选战制胜的关键,靠分析选民数据赢得大选的最出名例子当属美国前总统巴拉克·奥巴马。在2008年大选中,他第一次尝试从数据分析中寻求帮助。奥巴马的竞选团队在关键州每星期进行五千到一万次短民调,一千次长民调,他们还给每个选民 1)在投票日当天出门投票 2)支持奥巴马的可能性都分别打了分。2012 年,奥巴马谋求连任,更是在选民数据这条路上走到了底。而在共和党那边,奥巴马 2008 年的对手麦凯恩,其团队只进行过一次主动民调。

既然抓取选民信息并进行民意操纵是如此常见的政治手段,那媒体为何要谴责 CA(以及特朗普)呢?

这还要从 CA 掌握的可怕的用户数据量说起。

在此之前,一直有特朗普靠高级算法获胜的传言,但专家认为,这种说法并不靠谱。因为离了数据的支撑,再神奇的统计方法也是空中楼阁,有意义的结论必须通过一定量级的数据才能得出。考虑到现实条件,想要获得足够左右大选结果的数据量,几乎是不可能的。

然而现实往往比电视剧更有戏剧性。如果你接着看 CA 的官网,会发现这样一段话:我们对超过两亿三千万美国选民进行了每人高达五千个数据点的数据采集,通过这些数据,我们可以为用户筛选出目标群体,接着改变他们的想法,改变他们的行动。

2.3 亿就是一个很可观,也很可怕的数字了——美国注册选民数总共也就 2.3 亿,2016 年在大选中投票者约 1.3 亿。而本次曝出 CA 掌握的用户信息高达 5000 万,几乎是 2016 年总票数的一半。

读到这里你可能会疑惑:为什么坐拥 2.1 亿美国用户的 Facebook 不自己去做竞选业务,反而让 CA 抢走了?

美国法律没有对本土企业参与本土选举进行限制,因此 Facebook 可以提供竞选广告。但作为一个流行社交网络,Facebook 已经成为名副其实的公众平台,帮助选举中的一方都意味着作为平台有失公允。所以 Facebook 即使拥有大量选民数据也不会直接参与助选,展示他人投放的广告是它可以做、也能赚到钱的服务。

但在现实中,Facebook 因在 2016 大选中放出了太多俄罗斯黑客和网络活动机构投放的广告,已经饱受诟病,因为美国选举法律明确说明,海外机构不得插手任何级别的本土选举。然而英国公司 CA 却并没有受到应有的谴责,直到最近违规窃取数据丑闻曝光,追查其干预美国选举的声音才热闹了起来。

可能人们一直接受了 CA 伪装的美国身份,抑或是这家在 2014 年就服务了 44 场美国竞选的公司,已经从政客那里得到了庇护。


 

Facebook 发布的声明解释了用户信息被盗的始末:2014 年,剑桥大学的两名心理学研究者亚历山大·科根 (Aleksandr Kogan) 和约瑟夫·钱斯勒 (Joseph Chancellor) 创办了一家名叫“全球科学研究” (GSR) 的小公司,并开发了一个心理测试功能的 App,内置了 Facebook 的登录和开放平台 Facebook Connect ,允许用户用自己的社交网络账号登录。

GSR 的用户协议以心理学研究为目的,索要用户授权,收集用户信息,其中包括用户所在地、点赞的内容、打开的链接等等,并抓取已授权用户的好友信息。凡是出现在用户时间线上的好友点赞和评论,App 都能一并收集。

实际上,科根是 CA 雇来的幌子。他通过 App 提取的 27 万用户数据,全部提供给了 CA,而 CA 为他的项目提供了约合 80 万美元的经费。

2016 年,美国纽约的一位传播学教授大卫·卡罗尔 (David Carroll) 想要从社交媒体上清理自己的个人信息,做了功课后却发现自己的信息被一家远在英国的公司采集了。这家公司正是 CA。

根据英国有关法律,他有权要回自己的信息。在回溯的信息里,卡罗尔却发现这家公司可能比他妻子还懂他

提供的报告中写道,卡罗尔不太可能支持共和党,在枪支问题关注度上得三分,在国家安全问题关注度上得七分,在传统价值和道德操守上得了九分。这份报告指出卡罗尔最关心的还是美国国债,这一项他得了十分满分。他在 Twitter 上公布了这份报告,说,我自己给自己打分也不过如此,可能还没它打得准。

这家公司正是 CA。通过 27 万肉鸡提供的数据,CA 构建了一个完全为竞选服务的选民心理统计模型。通过这个模型,该公司很快爬取和处理了更多 Facebook 用户的数据。据《卫报》报道,截至 2015 年中, CA 拥有的 Facebook 用户数据已经达到“数百万”。

 CA 为卡罗尔制作的报告
CA 为卡罗尔制作的报告

在争取摇摆票时,这种精确的选民分析往往能够起到决定性的作用。理论上,特朗普竞选团队会向卡罗尔以及和他立场相近的选民推送特朗普推行贸易保护政策”、“创造就业机会”、“解决美国中产危机等话题的广告,抑或推送希拉里身陷邮件门丑闻”、“疑与多名男性有染的信息。

可想而知,道德情操得分极高、关注国家债务的卡罗尔教授会把票投给谁了。尽管他“不太可能支持共和党”,这些推送也足够断绝他对特朗普的政治敌人可能存在的信任或幻想。

在整个事件中,Facebook 又扮演了怎样的角色呢?

时间拨回 2015 年。CA 收购了科根和钱斯勒的 GSR 公司。科根继续在剑桥大学工作,钱斯勒却在这段短暂的工作结束后被 Facebook 招募到了硅谷总部,职位为“量化社会心理学家”(quantitative social psychologist)。

硅谷公司招人,就算不盘到祖宗十八代,也至少会把候选人的上家和前份工作内容问清楚。也就是说,Facebook 最早在 2015,甚至 2014 年就理应知道 CA 如何获取 Facebook 最隐私的用户数据,以及怎样将它们用于政治用途用户画像的。

Facebook 在 2015 年就理应封闭 CA 的接口,彻查此事,并负起一家上市公司应负起的责任:告知公众他们的用户信息可能被用于未经授权的用途。

然而 Facebook 没有这样做。

至于 Facebook 是否有意借 CA 之手,为未来可能更需要操纵美国选举做了一次 beta testing,那就不得而知了。


 

经过一个周末的发酵,CA、Facebook 都被推上了舆论的风口浪尖。

CA 的各种糗事被不断曝光,被挖出跟有俄国政府背书的石油公司 Lukoil 共享统计模型和数据抓取方法;CEO 尼克斯和公司高管出现在了一则“钓鱼采访”的视频里,向扮演成客户的调查作者大吹自己和公司如何蒙骗立法机构,在各国操纵选举,甚至开黄腔抖出了曾在欧洲国家选举中雇佣色情工作者勒索政客的事情。

在事件中成为关键爆料人之一的 CA 前员工怀利,也吸引到了大量的关注。和漩涡中的尼克斯、科根等其他人不同,怀利在关键的时刻选择了站在揭露真相,而不是掩盖真相的一边。这让曾经作为整个谎言机器关键螺丝,无论如何都无法洗刷罪恶的他,像是第二个爱德华·斯诺登 (Edward Snowden)。

Facebook 则被谴责没有在三四年前就向监管机构和个人通报,长期忽视用户信息安全。当地时间周二,英国议会直属的信息专员办公室(类似于中国工信部)已经向法院申请搜查令,对 CA 办公室和其数字资产进行直接调查,并已经通知 Facebook 立即停止内部审计,以免其摧毁证据。

如果 CA 遭遇英美两国信息安全法的审判,Facebook 恐已唇亡齿寒。

Facebook 发了声明,但公众并不买账。美国时间周一中午,Facebook 股价一度暴跌 6.8%,市值蒸发 367 亿美元。其创始人兼 CEO 马克·扎克伯格今年一直在卖股票,而卖出的单子遇上了好时候:财经媒体 MarketWatch 估计,他在周一股价自由落体之前卖出的股票让他少赔了 4000 万美元左右——这笔钱足够做总统竞选宣传了。

特朗普则一直在风口浪尖上。他在性丑闻和通俄门”事件中沾的一身污水还没洗干净,现在又被牵扯上 CA 助选事件。已经掌握了大量人证和物证的 FBI 特别检查官罗伯特·穆勒 (Robert Mueller) 上周末应该挺忙。

最后,不妨看看《纸牌屋》里的威廉·康威是如何应对危机的:

康威与搜索引擎的合作终于引起了媒体的重视,如果放任不管,恐怕下一步就将迎来司法部的调查。虽然挖掘用户数据属于灰色地带,法律没有明确监管,但如果司法部指控网站非法盈利,那么这笔赔偿金谁都无法负担

威廉尝试用政治手腕解决问题,但没有成功。他不得不正面回应此事。他以朋友的身份与 Pollyhop 创始人一同露面,告诉大家自己所做的一切都是为了更好的了解民意,最后他与大家分享了自己漂亮妻子和可爱儿女的照片视频,不仅提高了自己的人气,还带动了 Pollyhop 的流量

反正扎克伯格肯定不会跟特朗普同框的。

下载品玩App,比99.9%的人更先知道关于「Facebook」的新故事

下载品玩App

比99.9%的人更先知道关于「Facebook」的新故事

iOS版本 Android版本
立即下载
邢逸帆

资深作者 联系邮箱:xingyifan@pingwest.com

取消 发布
AI阅读助手
以下有两点提示,请您注意:
1. 请避免输入违反公序良俗、不安全或敏感的内容,模型可能无法回答不合适的问题。
2. 我们致力于提供高质量的大模型问答服务,但无法保证回答的准确性、时效性、全面性或适用性。在使用本服务时,您需要自行判断并承担风险;
感谢您的理解与配合
该功能目前正处于内测阶段,尚未对所有用户开放。如果您想快人一步体验产品的新功能,欢迎点击下面的按钮申请参与内测 申请内测