当心“赞”字揭你的底 --科技日报数字报

今日视点

英国剑桥大学研究人员在《美国国家科学院院刊》杂志发表的一项最新研究表明，对脸谱（Facebook）网站用户的“赞”（Like）信息进行自动分析，即可非常准确地推断出该用户的种族、年龄、智商、性别、个性、物质滥用和政治观点等。而“赞”信息作为缺省值目前是公开的。

在这项研究中，研究人员将脸谱的“赞”按钮作为数字记录的“通用类别”，这有点类似于网页搜索查询和浏览历史。研究表明，这种技术可用于提取几乎每个定期在线网民的敏感信息。

在微软剑桥研究院的合作下，英国剑桥大学心理测试中心的研究人员对58000多名美国脸谱用户的数据集进行了分析，这些用户通过“我的个性”应用程序自愿提供其个人喜好、人口概况和心理测试结果。这些用户选择性提供数据，并同意将记录的个人信息用于分析。

研究人员创建的统计模型只需单独使用脸谱的“赞”信息就能预测出个人的详细情况。模型预测男性性别的准确性为88%，区分非裔美国人和白种美国人的准确率为95%，共和党人和民主党人的区分度达到85%，基督徒和穆斯林的准确分类率为82%，在关系状态和物质滥用方面的预测精度也相当高，介于65%至73%之间。

但是，很少有用户会点击“赞”按钮来明确揭示某些属性。例如，低于5%的同性恋用户会对“同性婚姻”这样明显的个人属性称“赞”。准确的预测结果取决于“推断”，即聚合大量信息量较少但更受欢迎的“赞”，如音乐和电视节目，从而捕捉到深度的个人资料。研究人员称，即使是用户父母是否在其21岁前离婚等看似不透明的个人资料，预测的准确度也能达到60%，这对形成该用户是否具有“广告价值”等信息已足够了。虽然研究人员的研究重点在于个性化营销的潜力，即利用预测模型来改善在线服务质量，但他们同时警告说，预测结果会对用户的隐私带来一定威胁。

许多网上消费者可能会觉得这样的数字暴露水平已超过其可接受的范围。如企业、政府甚至个体都可使用预测软件，从脸谱的“赞”和其他数字痕迹准确地推断出高度敏感的信息。

研究人员还对包括智力、情绪稳定性、开放性和外向性在内的人格特质进行了测试。尽管这些潜在特质更难衡量，但分析精度仍是惊人的。开放性研究表明，通过单独观察“赞”得到的信息量与实际性格测试得分大致相当。某些“赞”与个性之间有着强烈的、但貌似不一致或随机的关系，如炸薯条和高智商。

当把它们作为一个研究整体时，通过单独分析脸谱“赞”得出的个人属性和人格特质的不同估值，甚至可以形成世界范围内数百万用户的惊人准确的个人肖像。研究结果表明，在此项研究基础上，心理评估业将以前所未有的规模发生革命，未来或将不再需要昂贵的评估中心和问卷调查。

研究人员表示，基于脸谱“赞”得出的成果，同样也适用于范围更广的其他网上行为。类似的预测可从各种各样的数字数据得出，这种二次“推断”在预测用户想要隐藏的敏感信息方面将具有统计学意义的非凡准确性。鉴于用户留下的数字痕迹的多样性，个体的控制将变得越来越难。

如果你是包括脸谱在内的新兴技术的忠实拥趸或活跃用户，你也许会非常欣赏其自动化的新书推荐，或是为你挑选你最感兴趣的新闻故事。不过，你也要想到，相同的数据和技术也可被用来预测你的政治观点或性取向，从而将你的自由甚至生命置于危险之中。这种情况一旦发生，将降低人们使用数字技术的热情，削弱个人和机构之间的信任，进而阻碍技术和经济的进步。用户需要提供对其信息使用的透明度和控制权。

研究人员指出，希望该项研究有助于关于用户隐私的持续讨论：消费者有理由期待，在他们使用的产品或服务中内置更加强有力的隐私保护措施。而该项研究要提醒消费者的是：在网上共享信息时要慎之又慎，一方面要设置隐私控制，另一方面坚决不与陌生人共享信息。