今日视点
研究恒星和对付癌症看起来似乎风马牛不相及,但大数据算法将两者关联到了一起,并成为其中的“弄潮儿”。
据英国广播公司报道,天文学家和肿瘤学家近日在英国剑桥大学召开跨学科会议,探讨如何对不断涌来的数据进行管理。在此次会议上,天文学家尼古拉斯·沃尔顿与英国剑桥癌症研究所的詹姆斯·布伦顿一见如故,与会人士也倾听了英国剑桥癌症研究所的卡洛斯·卡尔达斯教授对未来如何使用大数据的畅想。
恒星算法可用来攻克癌症
会议上,卡尔达斯说:“天文学家们需要对望远镜拍摄的天空图片进行深入研究,但无法通过人工筛查数百万张图片,因此,他们用成像算法来对物体进行分析和归类。那么,可以用同样的算法对仪器拍摄的人体图像进行深入研究吗?”
答案无疑是肯定的!而且,这一算法一直在推动癌症领域的研究。
卡尔达斯进一步解释说:“使用这些天文学算法,我们能自动对数十万个细胞进行归类,能研究模式,研究细胞之间如何关联,精算出有多少细胞以及它们之间的距离。这一算法加快了诊断进程,也使一些以前被掩盖或忽视的信息重见天日,为我们所用。”
卡尔达斯一针见血地指出:“这一算法将病理学完全转变到数字领域。”
英国癌症研究所的研究人员最近在“阅读”乳腺癌细胞方面取得了重大突破,他们收集了超过30万个乳腺癌细胞的数百万张图像,对其中的细胞形状和不同基因的数据进行分析,创造了一份3D“地图”,显示了乳腺癌细胞形状与基因打开和关闭间的关联,并将其与真正的疾病诊断结果进行匹配。
英国癌症研究所首席科学家凯伦·沃斯顿教授说:“了解乳腺癌的外观和行为与其基因组成之间的联系,将有助研究人员更好地了解该疾病。”
大数据分析让多领域受益
当然,从大数据中受益的不仅包括疾病诊断。埃森哲咨询公司总经理尼克·米尔曼解释称:“在健康领域,以前用于市场分析以了解个人偏好的技术,现在也能应用于保健,如鼓励某人遵循更健康的饮食习惯等。”
英国伦敦科学博物馆最近在举办一个展览,其中一个主题正是大数据。该展览不仅展示了大数据对工业的影响和重塑,也关注我们的“数据脚印”对自身隐私的影响。
此次展览的负责人谢尔顿·帕奎因在接受英国广播公司采访时表示:“这场静悄悄的革命(大数据)已经彻底改变了我们生活的方方面面,从如何看待恒星,到如何看病,再到人们之间如何交流。现代社会通过技术彼此关联交织在一起,我们拥有的所有事物都与大数据有关。”
帕奎因说:“我们现在能研究语言的进化历史,为研究疾病搜索基因组等,人们之间日益紧密的关联也在使我们更容易被研究。”
信息和数据即是金钱
这一展览上的一项研究让人印象深刻。这项由剑桥大学进行的研究证明,通过用户在社交媒体脸书上留下的“点赞”记录,可轻易地了解用户的个性特点。
研究人员要求志愿者完成一系列性格测试,然后再将测试结果同他们在脸书上留下的数据进行比较。戴维斯·史迪威说:“我们发现这两者的匹配度非常高,如此一来,我们或许可以通过脸书上的数据脚印来预测某个人的个性特点,包括智商、年龄、性格、性别以及宗教信仰等。”
而且,他们开发的“可预测的世界(Predictive World)”算法,会利用用户的脸书数据生成用户的心理情况,同时找出性别和薪水、位置、犯罪风险,以及性格和预期寿命之间的关系。
现在,该研究团队正在同游戏出版商育碧公司合作,帮助公司推销其充满未来主义色彩的游戏“看门狗2(Watch Dogs 2)”。
越来越多公司尝试让人们更好地理解与他们有关的数据,并出售这些数据,CitizenMe是其中的翘楚。
人们能借助CitizenMe从互联网收集自身数据的副本,并将其放入手机APP中。该公司创办人圣约翰·迪金斯表示:“这些信息和数据很快会变得非常值钱。如果用户愿意,可以选择匿名出售这些数据赚钱。”目前约有1万人使用这一APP。
延伸阅读
我们有多少数据?
每分钟有35万条推特“现身”;
每分钟有400小时的视频上载到YouTube;
每分钟有300万条Facebook帖子被制造出来;
每分钟有400万个Facebook“点赞”;
每分钟有400万次谷歌搜索;
目前,全球每天有2.5×1018字节的数据在流通,90%的数据于近两年“诞生”;
到2020年,全球将有44泽(1泽=270)字节的数据在流通。