一种带有卷积结构的深度神经网络,通过特征提取和分类识别完成对输入数据的判别
输入层
可以处理多维数据,一般处理图像居多,输入层对输入特征进行标准化处理,有利于提升卷积神经网络的学习效率和表现。
进行预处理的主要原因:数据范围影响,输入数据单位不一致,激活函数值域影响
卷积层
提取一个局部区域的特征,不同的卷积核相当于不同的特征提取器
主要应用在图像处理上,而图像为二维结构,因为为了更充分的利用图像的局部信息
通常将神经元组织为三维结构的神经层,其大小为高度M*宽度N*深度D, 由D个M*N大小的特征映射构成
池化层
包含预设定的池化函数;
将特征图中单个点的结果替换为其相邻区域的特征图统计量;
对数据进行降维,减少数据特征,减少网络参数和运算次数, 避免过拟合,常用方法为最大值池化和均值池化
全连接层
神经元排成一列,这些神经元与前一层神经元通过权值互连,呈全连接结构
等价于传统前馈神经网络中的隐含层,通常位于卷积神经网络的最后部分,并向其他全连接层传递信号
输出层
通常是全连接层,因此结构和工作原理与传统前馈神经网络中的输出层相同。
一维卷积应用:文本分类,语音识别,机器翻译
二维卷积:垃圾分类,车牌识别,图像搜索
三维卷积:医学领域,视频处理领域(监控中识别表情, 宠物或婴儿是否)