新鲜事
神经网络智能有推理能力吗?还是仅靠肤浅的统计数据?据量子位报道,为检测人工智能是否具备推理能力,近日DeepMind想出办法,给AI搞了一套IQ测试题。
他们构建了一个问题生成器,涉及一组抽象因素,包括渐进之类的关系,以及颜色和大小等属性,能产生大量独特问题。通过约束生成器可用的因子或组合,研究人员可以创建用于训练和测试模型的不同问题集,看看模型究竟能“聪明”到什么程度。
通过实验,DeepMind研究团队发现,当模型在测试中能够正确推断出任务背后的抽象概念时,就能产生良好的性能表现——IQ测试正确率可达87%,否则的话,蒙对答案的概率只有32%。
研究结果表明,想得出关于泛化的普遍结论可能是无益的。参与测试的模型表现良好与否取决于一系列因素,而几乎在所有情况下,系统在需要推断超出其经验的输入,或处理完全不熟悉的属性时,表现不佳。