经典循环神经网络之 LSTM 的扩展 发表于 2023-07-07 分类于 人工智能 , 深度学习 , 循环神经网络 本文字数: 1.5k 阅读时长 ≈ 1 分钟 References: LSTM Recurrent Networks Learn Simple Context-Free and Context-Sensitive Languages LSTM: A Search Space Odyssey Understanding LSTM Networks 深度学习:长短期记忆模型LSTM的变体和拓展(GRU模型等) 机器学习笔记 :LSTM 变体 (conv-LSTM、Peephole LSTM、 coupled LSTM、conv-GRU,TPA-LSTM) 【窥视孔连接】在 LSTM 中,当前时间步的状态不能影响到三个门在下一时间步的输出,这使得整个单元状态对上一单元模块的序列处理中丢失了部分信息 阅读全文 »
经典循环神经网络之 LSTM 发表于 2023-07-06 分类于 人工智能 , 深度学习 , 循环神经网络 本文字数: 2.7k 阅读时长 ≈ 2 分钟 References: Long short-term memory Learning to Forget: Continual Prediction with LSTM 史上最详细循环神经网络讲解(RNN/LSTM/GRU) 循环神经网络(RNN)知识入门 LSTM原理 人人都能看懂的LSTM 人人都能看懂的LSTM介绍及反向传播算法推导(非常详细) 认认真真学一下LSTM 【概述】长短期记忆(Long Short-Term Memory,LSTM)单元是 RNN 存储单元的一种变体,使用 LSTM 单元的 RNN 可以解决长序列数据训练过程中的梯度爆炸与梯度消失问题 阅读全文 »
循环神经网络的梯度问题 发表于 2023-07-04 分类于 人工智能 , 深度学习 , 循环神经网络 本文字数: 2.6k 阅读时长 ≈ 2 分钟 References: Learning Longer Memory in Recurrent Neural Networks Learning long-term dependencies with gradient descent is difficult RNN 的梯度消失问题 RNN梯度消失与梯度爆炸推导 理论推导RNN梯度消失和梯度爆炸的原因 RNN梯度消失和爆炸的原因 【概述】在深度学习中,梯度对 BP 网络的训练起到了十分重要的作用,而梯度爆炸和梯度消失,是十分常见的两个问题 阅读全文 »
时序反向传播算法 BPTT 发表于 2023-07-03 分类于 人工智能 , 深度学习 , 循环神经网络 本文字数: 3.6k 阅读时长 ≈ 3 分钟 References: Backpropagation Through Time: What It Does and How to Do It 详解循环神经网络(Recurrent Neural Network 时序反向传播算法(BPTT) BPTT算法推导 【概述】RNN 是一种基于时序数据的神经网络模型,根据其前向传播公式可知,优化的目标是计算损失函数关于参数 $U$、$V$、$W$ 以及两个偏置 $\mathbf{b}_o$、$\mathbf{b}_h$ 的梯度,然后使用梯度下降法学习出好的参数 阅读全文 »
循环神经网络的结构 发表于 2023-07-01 分类于 人工智能 , 深度学习 , 循环神经网络 本文字数: 2.2k 阅读时长 ≈ 2 分钟 References: SERIAL ORDER: A PARALLEL DISTRIBUTED PROCESSING APPROACH Finding Structure in Time 一文搞懂RNN(循环神经网络)基础篇 详解循环神经网络(Recurrent Neural Network) 循环神经网络(RNN)知识入门 史上最详细循环神经网络讲解(RNN/LSTM/GRU) RNN两种网络类型(Jordan network和Elman network)区别 【单元结构】在传统的神经网络中,假设所有输入彼此独立,但对于某些任务来说,需要处理序列信息,即前面的输入和后面的输入是有关系的 阅读全文 »
序列信息与循环神经网络 发表于 2023-06-28 分类于 人工智能 , 深度学习 , 循环神经网络 本文字数: 1.7k 阅读时长 ≈ 2 分钟 References: Recent Advances in Recurrent Neural Networks 【引入】使用全连接神经网络,都只能单独的去处理一个个的输入,前一个输入和后一个输入之间没有任何联系的,即输入之间是彼此独立的 阅读全文 »
迁移学习 发表于 2023-06-26 分类于 人工智能 , 深度学习 , 神经网络基础 本文字数: 892 阅读时长 ≈ 1 分钟 【概述】迁移学习(Transfer Learning)是利用数据、任务或模型之间的相似性,将在旧领域训练好的模型,应用于新的领域这样的过程,要求两个任务的输入属于同一性质,即要么同是图像、要么同是语音或其他 当有海量的数据资源时,能够很容易从海量数据中学习到一个鲁棒性很强的模型,可以不需要迁移学习 阅读全文 »
经典卷积神经网络之 ResNet 发表于 2023-06-25 分类于 人工智能 , 深度学习 , 卷积神经网络 本文字数: 3.6k 阅读时长 ≈ 3 分钟 References: Deep Residual Learning for Image Recognition (二十七)通俗易懂理解——Resnet残差网络 ResNet 详解 残差神经网络(ResNet) 深度学习之残差神经网络(ResNet) 你必须要知道CNN模型:ResNet 经典CNN结构简析:AlexNet、VGG、NIN、GoogLeNet、ResNet etc. 一文读懂LeNet、AlexNet、VGG、GoogleNet、ResNet到底是什么? 【概述】ResNet 残差神经网络是由微软研究院的何恺明等人提出的,获得了 2015 年 ImageNet 比赛的冠军,其将图像分类识别错误率降低到了 $3.6\%$,这个结果甚至超出了正常人眼识别的精度 阅读全文 »
经典卷积神经网络之 GoogLeNet 发表于 2023-06-25 分类于 人工智能 , 深度学习 , 卷积神经网络 本文字数: 2.8k 阅读时长 ≈ 3 分钟 References: Going Deeper with Convolutions 【深度学习】论文导读:GoogLeNet模型,Inception结构网络简化(Going deeper with convolutions) 深度学习|经典网络:GoogLeNet(一) GoogLeNet的心路历程(二) GoogLeNet学习心得 深入理解GoogLeNet结构 经典CNN结构简析:AlexNet、VGG、NIN、GoogLeNet、ResNet etc. 一文读懂LeNet、AlexNet、VGG、GoogleNet、ResNet到底是什么? 【概述】GoogLeNet 是 2014 年 ImageNet 比赛的冠军,与 VGG 是该年 ImageNet 的双雄,这两类模型结构有一个共同特点,即加深网络深度 阅读全文 »
经典卷积神经网络之 NIN 发表于 2023-06-24 分类于 人工智能 , 深度学习 , 卷积神经网络 本文字数: 822 阅读时长 ≈ 1 分钟 References: Network In Network 经典论文之NIN (NIN网络)Network in Network论文阅读笔记 经典CNN结构简析:AlexNet、VGG、NIN、GoogLeNet、ResNet etc. 一文读懂LeNet、AlexNet、VGG、GoogleNet、ResNet到底是什么? 【概述】AlexNet 的绝大多数参数都集中在最后几个全连接层上,但全连接层不仅参数多,还具有强线性性,同时还容易发生过拟合 阅读全文 »