如何在MATLAB中验证概率神经网络给出的输出？

rcty 发表于 Dev

rcty

我对学习神经网络感兴趣，例如，我尝试了以下通过实验得出的数据集。

我在神经网络中使用以下输入向量；

X = [1 1; 1 2; 1 3; 1 4; 4 1; 4 2; 4 3; 4 4; 7 1;7 2; 7 3; 7 4]';
Tc = [1 1 2 3 1 1 2 2 1 1 2 2];

我想将输入数据分为三类，分别由输入向量Tc描述。然后，我将目标类别索引Tc转换为向量T，而我使用的扩展值是1。

使用MATLAB中的newpnn函数，我得到了这三个类的决策边界。

我对验证决策边界是否合适感到怀疑。我正在使用X =[2;3.55]属于第2类的单个数据来验证输出。它在输出图中以黑点表示。蓝色是1类。黄色是2类区域。红色是3类。

如该图所示，发现神经网络的预测为类别2，与该集合的实际类别一致。

那么，这是否意味着我的神经网络是正确且经过验证的？

PS我对神经网络有基本的了解。此外，我了解拥有更多培训示例和验证集的概念。我希望能找到适合于可用细节的答案，因为我无法通过实验获得更多数据。

亚历克西斯·克莱兰博

嗯，我认为您不太了解验证是指神经网络。您无法仅使用一个样本来检查网络。因此，我将尝试教您有关验证神经网络的知识。这是一个漫长的统计过程，涉及对“现实世界的数据”，“预期的行为”等的反思。...您无法使用10-20个数据和一个验证点来验证某些东西。

通常，当您教一个神经网络时，您应该有3套：

例如，我们正在建立一种算法来检查一个人是否“有一定机会变得富有”。这是您制作和验证神经网络的方法。

首先，我们问1万个人是否有钱，然后检查一些参数（年龄，位置等）。它构成了“原始数据集”。
我们将10000人的清单分为3组（6000 2000和2000）：训练集，验证集和测试集（注意：比例可以根据验证程序而变化）。
我们应用学习集（第一个6000个数据），并将其应用到不同的神经网络中进行教学（我们将其命名为A，B，C和D）
我们使用验证集（下一个2000个数据）来检查四个网络的性能。这是避免过度拟合的方法。假设网络A根本不是一个网络，它只是一个记录器。它记录了不同的数据及其类，但根本无法预测任何内容。如果我们用6000第一人称进行验证测试，那么“虚拟算法”将给出100％的结果，但是在该测试上将完全失败。因此，在测试之后，您可以选择“最佳算法”。让我们选择C。
现在，我们使用其余的数据（测试集或新数据，如果可以的话，它总是更好）运行C。如果我们发现C具有非常奇怪且不可预测的行为（它可能是由某些人为错误引起的，例如创建的集并非真正独立或仍然正确，例如，如果数据来自1996年），我们选择另一种算法或我们尝试检查数据或算法有什么问题。