作者:禅与计算机程序设计艺术
1.简介
在深度学习、神经网络、强化学习等领域,大量的机器学习模型被提出,其中最火热的就是深度学习模型。深度学习模型能够非常好的解决大量的数据分类和回归任务,且取得了非常好的效果。然而,如何找到合适的深度学习模型,还是一个很重要的问题。因为任何模型都需要大量的参数配置,耗费大量的时间进行训练和调优。因此,如何有效的快速搜集到足够多的深度学习模型,然后对它们进行评估、比较和选择,就成为了一个研究热点。而本文所讨论的主题,即自动模型搜索与架构优化,就是关于这一方向的一项重要工作。
目前,自动模型搜索与架构优化可以分为两大类,一类是基于超参数的自动模型搜索方法,如网格搜索法(Grid Search)、随机搜索法(Randomized Search);另一类是基于结构(architecture)的自动模型搜索方法,如Evolutionary Algorithm(EA),先进的优化算法通过逐渐修改架构来生成新的模型。
最近几年,深度学习界越来越多的文章开始关注模型的压缩,即用更少的计算资源同时达到相似甚至更好的性能。在模型的压缩上,有一些尝试性的方法,比如微调(fine-tuning),但这些方法只能保证轻微的性能提升,并不能完全克服计算资源瓶颈。而在这个问题上,目前仍然缺乏统一的理论和技术方案。希望能通过本文的阐述,帮助读者了解自动模型搜索与架构优化的研究现状和最新进展。
2.基本概念术语说明
2.1 深度学习模型
深度学习模型(