Multilayer Perceptron

多层感知器,最基本的神经网络结构,也是最经典的结构。

Perceptron 感知器

一个感知器就是神经网络中的一个神经元,包含一个线性结构和一个激活函数。由多层感知器层叠起来的神经网络就是 MLP。

结构

以上,一个典型的 MLP 结构。由三层构成:

  • 输入层,Input Layer:用于接收输入数据。
  • 隐藏层,Hidden Layter:用于在 Input 中寻找隐藏模式的信息。
  • 输出层,Output Layer:用于将隐藏信息翻译为用户能读懂的内容并展示。

每一层各司其职,有不同的功能。

应用

  • 分类任务:根据输入,给出分类类型的结果
  • 回归任务:找输入到输出的回归关系
  • 特征提取:在训练好的 MLP 中,隐藏层中的参数代表了输入数据的隐藏特征,也就意味着可以从隐藏层中提取隐藏的数据。

一般来说 MLP 的输出形式有限,所以一般用于识别、分类和回归任务。

重要概念

  • 激活函数一般包括:sigmoid ReLUsoftmax 三种不同的函数
  • 前向传播算法,用于从 Input 数据,计算 Output 输出
  • 反向传播算法,用于从 Output 输出逆推,得到模型中的参数数据
  • 损失函数,评估模型输出的准确性,用于进一步反向传播算法
  • 反向传播的优化:在损失函数的评估下,对内部神经元的参数求导,获得更新的神经元参数。将模型更好拟合到输入数据上。