2018年05月02日 星期三
先进模型教电脑判断文字作者性别

    俄罗斯国立核能研究大学莫斯科工程物理学院(MEPhI)、全国科研中心“库尔恰托夫研究所”和沃罗涅日国立大学联合专家团队合作,研究出教电脑通过一个人写的文字内容判断其性别的方法,准确率达80%。此次研究受到俄罗斯科学基金的资助,相关结果发布在《Procedia Computer Science》网站上。

    众多科学研究表明,书面文字必然反映作者特点,包括性别、心理特征、教育程度等。言语是大公司人事部门和安全机构专家所使用的重要心理诊断工具。

    分析一个人的言语可以判断其是否存在某些疾病(痴呆、抑郁症等),是否有自杀倾向。专家团队评估了利用神经网络分析文本的各种机器学习技术的效果。

    该学院副教授亚历山大·斯博耶夫表示:“得益于先进的神经网络模型,在文本作者不刻意隐藏自己性别的情况下,我们在确定文本作者性别方面取得了很好的结果。”

    例如,从交友网站上选取的文本,神经网络轻易就能判断谁故意使用了异性名字,准确率为百分之百。

    研究结果表明,使用卷积神经网络和深度学习法来判断文本作者性别,以此为基础的方法最为有效。

    目前专家团队正在研究如何判断年龄。

    (本栏目稿件来源:“卫星”新闻通讯社 整编:本报记者 房琳琳)

京ICP备06005116