Alex_McAvoy

想要成为渔夫的猎手

Reference:

【概述】

如下图所示,卷积神经网络由若干个卷积层和池化层进行局部特征识别和降维,之后再利用生成的特征图用全连接层去处理

阅读全文 »

Reference:

【网络结构】

卷积神经网络由一个或多个卷积层、池化层以及全连接层等组成,其也可以使用反向传播算法进行训练,其架构如下

阅读全文 »

Reference:

【卷积核】

卷积核(Convolutional Kernel)是一个大小为 $n\times n$ 的矩阵,用于检测图像中特定的特征,在某一个卷积核对图像进行卷积运算(Convolution)时,就是将卷积核分别与图像的同大小区域进行点乘求和,依次从左到右从上到下滑过图像的所有区域,最终得到特征图(Feature Map)

阅读全文 »

【概述】

在神经网络中,对于图片数据集中的数据,不仅要求数据相关,而且要求有尽可能大的数据量,但要想得到大量的数据,不仅要收集各种情景下、各种角度、各个位置的照片,还要确保数据的多样性,只有这样才能确保神经网络学到的特征更加全面

在现实中,若想达到以上的目的要付出巨大的代价,并且还要对照片上出现的东西进行准确标注,另外对于一些稀有的物种信息收集更是十分困难

阅读全文 »

References:

【概述】

机器学习的模型评估 中,介绍了偏差、方差、噪声、偏差-方差分解以及偏差-方差窘境

阅读全文 »

【指数加权平均】

指数加权平均(Exponentially Weight Average)是一种常用的序列数据处理方式,通常用于序列分析,例如金融序列分析、温度变化序列分析等

其过程如下:

阅读全文 »

【局部最优问题】

在求解最优化问题时,凸优化问题有全局最优解与局部最优解的区别

全局最优是指求一个问题在全值域范围内最优,局部最优是指一个问题的解在一定范围或区域内最优,或者说解决问题或达成目标的手段在一定范围或限制内最优

阅读全文 »

【概述】

由于在训练神经网络期间前一层的参数发生了变化,这导致了每层输入的分布不同,难以通过较低的学习率和参数初始化来减慢训练速度,同时要训练的具有饱和非线性模型也十分困难,这种现象被称为内部协变量偏移(Internal Covariate Shift)

论文 Batch Normalization: Accelerating Deep Network Training by Reducing Internal Covariate Shift 中提出了批量归一化(Batch Normalization,BN)这种数据归一化方法来解决该问题

阅读全文 »

【梯度爆炸与梯度消失】

目前优化神经网络的方法基本都是基于反向传播的思想,即根据损失函数计算的误差通过反向传播的方式,逆向对网络权值进行更新

梯度消失和梯度爆炸是最常见的两个问题,它们会影响模型的收敛速度和性能

阅读全文 »