分享:

DARPA推出“更少标记的学习”的新项目

2018-08-28 12:18:18 中国航空报 姚保寅

据美国国防预先研究计划局(DARPA)官网报道,机器学习(ML)系统通过实例学习提取了大量数据。随着系统不断发展,深度神经网络(DNN)成为机器学习模型中的最新技术。但训练DNN需对大量数据(109或1010个)进行标注,成本昂贵且耗时;且ML模型脆弱,环境稍微变化就容易失效,而修改模型代价与从头创建无异。

为减少训练和调整模型的前期成本和周期,DARPA推出“更少标记的学习”(LearningwithLessLabels,LwLL)的新项目,研究新算法,可显著减少训练或调整代价:构建模型所需数据量减少一百万倍,调整模型所需数据量从数百万减少至数百个。昔日需一百万张图像来训练系统,将来只需一张图像。

项目重点研究两个技术领域。第一个侧重构建有效学习和适应性的学习算法,研发在不牺牲系统性能前提下,通过既定计划指标,减少所需数量标签先例的算法。研究人员将在元学习,迁移学习,主动学习,k-shot学习以及监督/无人监督适应性等领域进行创新;第二个要求研究人员规范描述机器学习问题,包括决策难度和用于制定决策的数据的真实复杂性。由于评估构建ML系统效率或者模型准确度水平限制因素方面存在困难,研究人员希望找到ML可能性的理论极限,并利用这一理论来推动系统开发。

深度神经网络(DNN)能以更高准确度进行机器翻译和模式识别,是人工智能最重要的关键技术之一。DARPA新项目将着力解决其对数据标签的依赖性,进一步推动人工智能的发展。

责任编辑:实习编辑 臧航