感知器训练规则，为什么乘以x

demalegabi 发表于 Dev

192

德马莱比

我正在阅读汤姆米切尔的机器学习书，他提到感知器训练规则的公式是

在哪里

: 训练率
: 预期输出
: 实际输出
: 第 i 个输入

这意味着如果很大，那么很大，但是当很大时我不明白大型更新的目的

相反，我觉得如果有大那么更新应该小，因为小的波动会导致最终输出的大变化（由于）

酸碱

调整是向量加法和减法，可以认为是旋转超平面，使得类0落在一个部分上，而类1落在另一部分上。

考虑一个表示感知器模型权重的权1xd重向量。另外，考虑一个1xd数据点。那么感知器模型的预测值，在不失一般性的情况下考虑一个线性阈值，将是

-- 等式 1

这里 '。' 是点积，或

上面方程的超平面是

（为简单起见，忽略权重更新的迭代索引）

让我们考虑，我们有两个类0和1，又不失一般性的损失，数据点标记0落在一个一侧方程1 <超平面的= 0，数据点标记1的另一边，其中公式1秋季> 0。

这是矢量正常该超平面。与标签数据点之间的角度0应是更那90度，并用标签数据点之间数据点1应小于90度。

有三种可能（忽略训练率）

：暗示这个例子被当前的权重集正确分类。因此，我们不需要对特定数据点进行任何更改。
暗示目标是1，但目前的权重集将其归类为0。方程 1。这应该是. 方程 1。在这种情况下是，这表明之间的角度和是大于 90度，这应该是较小的。更新规则是。如果您想象在 2d 中添加向量，这将旋转超平面，使和之间的角度比以前更近且小于90度数。
暗示目标是0，但目前的权重集将其归类为1。方程 1。这应该是. 方程 1。在这种情况下是表示之间的角度和是较小那 90度，这应该是较大的。更新规则是。类似地，这将旋转超平面，使和之间的角度大于90度。

这是反复迭代，超平面被旋转和调整，使得超平面的法线角度90与类标记为数据点的角度小于度数，而与类标记为的数据点的度数1大于90度数0。

如果的量级很大就会有很大的变化，因此在过程中会出现问题，并且可能需要更多的迭代才能收敛，这取决于初始权重的大小。因此，对数据点进行归一化或标准化是一个好主意。从这个角度来看，很容易可视化更新规则究竟在做什么（将偏差视为超平面方程 1 的一部分）。现在将其扩展到更复杂的网络和/或阈值。

推荐阅读和参考：神经网络，Raul Rojas 的系统介绍：第 4 章

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2021-06-29

我来说两句

0 条评论

登录后参与评论

相关文章

感知器训练的Delta训练规则

训练默认感知器标记器

创建单个感知器进行训练

什么是带有滑动窗口的多层感知器以及如何进行训练和测试

什么是感知器学习算法？

C语言中的感知器无法训练

感知器权重更新规则的直觉

为什么2D感知器的VC维度为3？

为什么这个内核感知器实现需要无限的时间来运行？

了解感知器

感知器学习算法

NOT函数的布尔感知器

多层感知器问题

对感知器功能的困惑

Python中的感知器

如何使用Keras训练和调整人工多层感知器神经网络？

来自内存有限的流的感知器训练

sknn多层感知器分类器

多维张量上的感知器

Weka数值类多层感知器

EmguCV中的多层感知器

感知器中的错误分类错误

多层感知器权重不变

Tensorflow中的多层感知器问题

单层感知器：合并偏置

澄清感知器的偏见

这种多层感知器反向传播实现有什么问题？

TensorFlow：使用自己的数据集实现单层感知器/多层感知器

加载NLTK感知器标记器时出现IOError

TOP 榜单

文章

热门标签

归档