Category: 深度学习 | mantch的博客

【深度学习】深度学习-优化方法

mantch

2019-08-19

深度学习

字数统计:

6.9k字

阅读时长≈

24分

机器学习模型在训练数据集和测试数据集上的表现。如果你改变过实验中的模型结构或者超参数，你也许发现了：当模型在训练数据集上更准确时，它在测试数据集上却不⼀定更准确。这是为什么呢？训练误差的期望小于或等于泛化误差。也就是说，⼀般情况下，由训练数据集学到的模型参数会使模型在训练数据集上的表现优于或等于…

阅读全文

【深度学习】强化学习

mantch

2019-08-18

深度学习

字数统计:

3k字

阅读时长≈

10分

其他许多机器学习算法中学习器都是学得怎样做，而强化学习（Reinforcement Learning, RL）是在尝试的过程中学习到在特定的情境下选择哪种行动可以得到最大的回报。在很多场景中，当前的行动不仅会影响当前的rewards，还会影响之后的状态和一系列的rewards。RL最重要的3个特定…

阅读全文

【深度学习】迁移学习

mantch

2019-08-18

深度学习

字数统计:

3.2k字

阅读时长≈

11分

迁移学习(Transformer Learning)是一种机器学习方法，就是把为任务 A 开发的模型作为初始点，重新使用在为任务 B 开发模型的过程中。迁移学习是通过从已学习的相关任务中转移知识来改进学习的新任务，虽然大多数机器学习算法都是为了解决单个任务而设计的，但是促进迁移学习的算法的开发是机…

阅读全文

【深度学习】长短期记忆(LSTM)

mantch

2019-08-17

深度学习

字数统计:

1.6k字

阅读时长≈

5分

在你阅读这篇文章时候，你都是基于自己已经拥有的对先前所见词的理解来推断当前词的真实含义。我们不会将所有的东西都全部丢弃，然后用空白的大脑进行思考。我们的思想拥有持久性。LSTM就是具备了这一特性。这篇将介绍另⼀种常⽤的⻔控循环神经⽹络：⻓短期记忆（long short-term memory…

阅读全文

【深度学习】门控循环神经⽹络(GRU)

mantch

2019-08-16

深度学习

字数统计:

1.2k字

阅读时长≈

4分

在循环神经⽹络中的梯度计算⽅法中，我们发现，当时间步数较⼤或者时间步较小时，循环神经⽹络的梯度较容易出现衰减或爆炸。虽然裁剪梯度可以应对梯度爆炸，但⽆法解决梯度衰减的问题。通常由于这个原因，循环神经⽹络在实际中较难捕捉时间序列中时间步距离较⼤的依赖关系。 门控循环神经⽹络（gated …

阅读全文

【深度学习】循环神经网络(RNN)

mantch

2019-08-15

深度学习

字数统计:

2.2k字

阅读时长≈

7分

1.2 为什么有了CNN，还要RNN? 现在我们考虑输⼊数据存在时间相关性的情况。假设是序列中时间步t的小批量输⼊，是该时间步的隐藏变量。那么根据以上结构图当前的隐藏变量的公式如下：从以上公式我们可以看出，这⾥我们保存上⼀时间步的隐藏变量，并引⼊⼀个新的权重参数，该参数⽤来描述在当前时间步…

阅读全文

【深度学习】卷积神经网络(CNN)

mantch

2019-08-11

深度学习

字数统计:

5k字

阅读时长≈

17分

上图中CNN要做的事情是：给定一张图片，是车还是马未知，是什么车也未知，现在需要模型判断这张图片里具体是一个什么东西，总之输出一个结果：如果是车那是什么车。这几个部分中，卷积计算层是CNN的核心。在做输入的时候，需要把图片处理成同样大小的图片才能够进行处理。 TIPS:在训练集和测试…

阅读全文

【深度学习】神经网络

mantch

2019-08-04

深度学习

字数统计:

6.2k字

阅读时长≈

22分

我们以房价预测的案例来说明一下，把房屋的面积作为神经网络的输入（我们称之为𝑥），通过一个节点（一个小圆圈），最终输出了价格（我们用𝑦表示）。其实这个小圆圈就是一个单独的神经元，就像人的大脑神经元一样。如果这是一个单神经元网络，不管规模大小，它正是通过把这些单个神经元叠加在一起来形成。如果你把这些神…

阅读全文