利用卷积神经网络实现手写字体识别
前文 利用神经网络实现手写字体识别 中构建的模型只单单使用了全连接层, 其中每一层的神经元都会与前一层的所有神经元相连接,这种结构其实更适合于结构化数据或一维数据。而像手写字体识别之类的图像结构数据,使用卷积神经网络其实会更合适一点,一方面通过卷积层可以提取局部特征,另一方面经过池化层还能减少参数量,提高处理效率。
1.卷积神经网络
卷积神经网络(Convolutional Neural Network,简称CNN)是一种特别适合处理图像、视频、语音、文本等数据的神经网络结构,它通过模仿生物视觉系统的工作原理,利用 卷积层、池化层 和 全连接层 来提取数据中的空间特征,并通过训练来优化参数,这在计算机视觉任务中有着广泛应用。
1.基本原理
CNN的核心思想是“卷积”操作。简单来说,卷积是用一个小的矩阵(称为卷积核)在输入图像上滑动,通过和图像的局部区域进行逐点相乘并求和,提取出图像的局部特征。卷积操作通常会在多个卷积层次上进行,从而能够识别图像中的简单特征(如边缘、纹理)和复杂特征(如物体、面部等)。