如何创建简单的三层神经网络并使用监督学习进行教学？

Luke 发表于 Dev

路加

基于PyBrain的教程，我设法将以下代码组合在一起：

#!/usr/bin/env python2
# coding: utf-8

from pybrain.structure import FeedForwardNetwork, LinearLayer, SigmoidLayer, FullConnection
from pybrain.datasets import SupervisedDataSet
from pybrain.supervised.trainers import BackpropTrainer

n = FeedForwardNetwork()

inLayer = LinearLayer(2)
hiddenLayer = SigmoidLayer(3)
outLayer = LinearLayer(1)

n.addInputModule(inLayer)
n.addModule(hiddenLayer)
n.addOutputModule(outLayer)

in_to_hidden = FullConnection(inLayer, hiddenLayer)
hidden_to_out = FullConnection(hiddenLayer, outLayer)

n.addConnection(in_to_hidden)
n.addConnection(hidden_to_out)

n.sortModules()

ds = SupervisedDataSet(2, 1)
ds.addSample((0, 0), (0,))
ds.addSample((0, 1), (1,))
ds.addSample((1, 0), (1,))
ds.addSample((1, 1), (0,))

trainer = BackpropTrainer(n, ds)
# trainer.train()
trainer.trainUntilConvergence()

print n.activate([0, 0])[0]
print n.activate([0, 1])[0]
print n.activate([1, 0])[0]
print n.activate([1, 1])[0]

本来应该学习XOR函数，但结果似乎是随机的：

0.208884929522

0.168926515771

0.459452834043

0.424209192223

要么

0.84956138664

0.888512762786

0.564964077401

0.611111147862

BartoszKP

您的方法有四个问题，在阅读《神经网络常见问题》后都可以轻松找到：

为什么要使用偏置/阈值？：您应该添加一个偏置节点。偏见的缺乏使学习非常有限：网络代表的分离的超平面只能通过原点。使用bias节点，它可以自由移动并更好地拟合数据：
```
bias = BiasUnit()
n.addModule(bias)

bias_to_hidden = FullConnection(bias, hiddenLayer)
n.addConnection(bias_to_hidden)
```
为什么不将二进制输入编码为0和1？：所有样本都位于样本空间的一个象限中。移动它们使其分散在原点周围：
```
ds = SupervisedDataSet(2, 1)
ds.addSample((-1, -1), (0,))
ds.addSample((-1, 1), (1,))
ds.addSample((1, -1), (1,))
ds.addSample((1, 1), (0,))
```
^{（相应地，将验证码固定在脚本的末尾。）}
trainUntilConvergence该方法使用验证工作，并且执行类似于早期停止方法的操作。对于这么小的数据集，这没有任何意义。使用trainEpochs代替。1000对于这个问题，时代对于网络而言已经足够了：
```
trainer.trainEpochs(1000)
```
反向传播应使用哪种学习率？：调整学习率参数。每当您使用神经网络时，便会执行此操作。在这种情况下，该值0.1甚至会0.2大大提高学习速度：
```
trainer = BackpropTrainer(n, dataset=ds, learningrate=0.1, verbose=True)
```
^{（请注意verbose=True参数。调整参数时，观察错误的行为至关重要。）}

有了这些修复程序，我就可以针对具有给定数据集的给定网络获得一致且正确的结果，并且误差小于1e-23。

本文收集自互联网，转载请注明来源。

如有侵权，请联系 [email protected] 删除。

编辑于 2020-10-30

我来说两句

0 条评论

登录后参与评论

为什么简单的2层神经网络无法学习0,0序列？

如何创建用于回归的神经网络？

如何使虚拟生物学习使用神经网络？

如何创建简单的三层神经网络并使用监督学习进行教学？

如何创建简单的三层神经网络并使用监督学习进行教学？

验证REST API参数

带有错误“ where”条件的查询如何返回结果？

使用SciPy的最小值来找到图中的最短路径

OpenGL纹理格式的颜色错误

未捕获的SyntaxError：带有Ajax帖子的意外令牌u

如何清除已撤销的GPG密钥？

OpenCv：改变 putText() 的位置

Python PIL putdata颜色必须为int或tuple

如何通过 iOS SDK 通过蓝牙将字体发送到 Zebra 打印机 (Zebra imz320)

如何从JavaScript中的MP3文件读取元数据属性？

如何根据Azure中的部署名称删除所有部署的资源

IE 11中的FormData未定义

混乱的EFI分区，启动时没有启动选项

如何在R中转置数据

Redux动作正常，但减速器无效

在 Python 2.7 中。如何从文件中读取特定文本并分配给变量

超过时间限制错误C ++

如何使用HttpClient的在使用SSL证书，无论多么“糟糕”是

如何对treeView的子节点进行排序

去噪自动编码器和常规自动编码器有什么区别？

在where子句中使用AVG函数和DATEADD进行嵌套查询