用于训练第一人工神经网络结构的过程、计算机系统、计算机程序和计算机可读介质的制作方法
未命名
10-26
阅读:103
评论:0
用于训练第一人工神经网络结构的过程、计算机系统、计算机程序和计算机可读介质
背景技术:
1.为了使计算机能够做出明智的决定(又名人工智能),它们必须使用某种形式的“世界模型”将原始传感器数据转换为可操作的信息。“传统”算法使用人为工程化的模型,针对手头特定的问题量身定制。这些算法在设计/训练期间通常只需要有限量的数据样本,因为适用范围窄且自由参数数量有限。
2.随着用于计算机视觉应用中的神经网络的兴起,2012年见证了计算机科学的转折点。与传统算法相比,人工算法不依赖于僵硬的、工程化的模型,而是有很多自由参数,它们可以从给定的数据样本中自己推断出模型。
3.这种途径有两个主要缺点:
4.1.这些算法需要大量的数据样本用来防止过拟合;
5.2.必须教算法如何解释每个单独的数据样本。
6.对于后一点,有两种主要策略:
7.1.无监督学习;
8.2.监督学习。
9.(非常)粗略地说,在监督学习中,每一个数据样本都被明确地标注了期望的输出。例如,一组图像被手动标记为“猫”或“攀爬”,以便算法能够区分这二者。
10.对于无监督学习,算法只被给出具有一些额外约束的抽象目标,比如:“将数据集划分为20个不同的组,并最大化组间的kl散度。”在本发明公开的上下文中,这还包括基于策略的学习方法。尽管在这个场景中,分组是在没有任何人为监督的情况下完成的,但仍然需要人类通过观察示例来标记每个组从而来提供语义。
11.文献us2006/0251292 a1可能代表了最接近的现有技术,所述文献公开了一种用于从图像中识别物体并认出图像与信息之间的相关性的系统和方法。
12.在一个实施例中,首先执行无监督学习步骤,然后由用户检查未被标记的类中的候选对象,以便在提供照片时或在他看到图像之后,将人与电子邮件地址或其他个人标识符相匹配。更进一步地,图像中识别出的人与他们的身份之间的关联可以通过无监督聚类与监督识别的组合来建立。如上所述,无监督聚类可以将人脸分组到聚类中。接下来,结果会展示给用户。用户带着纠正任何错误的分组与错误,以及将两组图像组合在一起(如果每组图像包含一样的身份)的目的来扫描结果。根据这份文献,这个算法以最小的用户工作量获得了监督学习的准确性。
技术实现要素:
13.根据本发明,提出了一种具有权利要求1的特征的用于训练第一人工神经网络结构的过程或方法、一种适于实施所述过程的具有权利要求12的特征的计算机系统、一种具有权利要求13的特征的计算机程序和一种具有权利要求14的特征的计算机可读介质。本发明的优选或有利实施例由从属权利要求、说明书和附图公开。
14.本发明的主题是一种用于训练第一人工神经网络结构的过程。第一人工神经网络结构优选地实施为人工神经网络。
15.人工神经网络结构适于将来自第一人工神经网络结构的输入端的数据样本在第一人工神经网络结构的输出端处分类为不同的类。至少其中一些类是通过第一人工神经网络结构由无监督学习生成和/或供给(filled)。这些类将在说明书中被称为无监督类。无监督学习应该优选地被理解为这样一种机器学习:所述机器学习在具有很少或根本没有人为监督的情况下,在不具有预先存在的标记的数据集中寻找先前未检测到的模式。
16.至少对于其中一个无监督类,训练第二人工神经网络结构用来生成人工候选对象,所述人工候选对象属于所述无监督类,尤其是看起来属于所述无监督类。换句话说,第二人工神经网络结构生成假的数据样本。
17.生成的人工候选对象在监督学习中被标记和/或标注,用于标记和/或标注所述无监督类。根据本发明,只有人工候选对象被标注/标记、由人类操作者检查,因此相应的无监督类也被标注/标记。
18.本发明因此提出了一种实现用于无监督类的半监督标记或标注的方法。本发明的优点是,无监督类的数据样本不向人类操作者公开,也根本不离开相应的计算机系统。例如,在数据集或数据样本优选地不应离开本地(premise)/装置的场景中,这个过程能够应用于分布式/边缘/在线学习。
19.在本发明的改进中,第一人工网络结构是用已标记的和/或已标注的人工候选对象训练的,以便标记和/或标注所述无监督类。通过这种改进,不仅将标记/标注转移到监督类,而且还用已标注的/已标记的人工候选对象训练第一人工神经网络结构,以便提供半监督类。换句话说,第二人工神经网络结构提供假的数据样本,这些样本能够由人类操作者标记和/或标注,并能够由第一人工神经网络结构使用。
20.通过仅联合训练概率函数而不是完整算法,敏感数据能够保存在本地,而输出能够全局使用。因此,优选是只将人工候选对象展示给人类操作者,而无监督类中的原始数据样本受限和/或保密。
21.在一个优选实施例中,第一人工神经网络结构实施为卷积人工神经网络和/或数据样本是图像。所述卷积人工神经网络包括至少一个或多个卷积层、至少一个或多个池化层和至少一个或多个全连接层。卷积神经网络(cnn或convnet)是一类深度神经网络,优选地应用于分析视觉图像。另外地和/或可替代地,数据样本是图像,例如rgb图像。第一人工神经网络结构的目的是对图像进行分类。
22.进一步优选的是,一部分类是由监督学习生成和/或填充的监督类。监督类基于由人类操作者标记和/或标注的训练数据。第一人工神经网络结构包括一部分监督类和一部分无监督类。进一步优选的是,主要部分是监督类,次要部分是无监督类。例如,超过80%的类是监督类。在这个优选实施例中,无监督类只是整个类的一小的剩余部分而使得大多数数据样本以监督方式分类。
23.在一个优选实施例中,第二人工神经网络结构通过改进相应的无监督类的概率密度函数来训练。简单地说,通过改进,尤其是与相应的实时的无监督类的概率密度函数相比减少或最小化第二神经网络结构的损失函数,第二人工神经网络结构得到改进,因此人工候选对象以改进的方式代表所述无监督类的成员。尤其地,损失函数是基于相应的无监督
类的概率密度函数计算第二人工神经网络结构的当前输出与预期输出之间的距离的函数。
24.在本发明的一个优选实施方式中,第二人工神经网络结构包括生成式人工神经网络。尤其地,所述生成式人工神经网络实施了生成式模型。所述生成式人工神经网络具有生成人工候选对象的功能并且能够被训练以提供改进的人工候选对象。
25.在第一个可能的实施方式中,第二人工神经网络结构另外包括判别式人工神经网络,其中,生成式和判别式人工神经网络形成生成对抗网络,其也被称为gan。简单地说,gan通过将生成器与判别器配对来实现它的功能,其中,所述生成器学习产生人工候选对象,所述判别器学习将相应的无监督类的数据样本与生成器的输出区别开。生成器试图欺骗判别器,而判别器则试图避免被欺骗。通过生成器和判别器的这种合作,产生改进的人工候选对象。
26.在第二个实施方式中,第一人工神经网络结构被实施为判别式人工神经网络,其中,所述生成式和这个判别式人工神经网络形成如上所定义的生成对抗网络(gan)。
27.在第一个实施方式中,gan能够专注于生成和改进人工候选对象,以便将功能简化为它的核心功能,从而降低gan的复杂性。在第二个实施方式中,gan包括第一人工神经网络结构,因此gan的判别器部分与第一人工神经网络结构中实施的判别器相同。因此,在训练gan时,判别器部分能够保持不变,只有生成器能够被优化以改进人工候选对象。
28.在另一个实施方式中,生成式人工神经网络是变分自编码器。例如,这种变分自编码器在kingma,diederik p and welling,max.auto-encoding variational bayes.arxiv preprint arxiv:1312.6114,2013中描述。进一步的变分自编码器和gan在lars mescheder,sebastian nowozin,andreas geiger:adversarial variational bayes:unifying variational autoencoders and generative adversarial networks arxiv:1701.04722v4/proceedings of the 34th international conference on machine learning,sydney,australia,pmlr 70,2017中描述。通过引用将所述文件公开的内容并入当前的说明书中。
29.就无监督类或所有无监督类而论,优选地是只有人工候选对象由人类操作者标记和/或标注。
30.本发明的进一步主题涉及一种计算机系统,据此,所述计算机系统适于实施如上所述的过程。本发明的进一步主题涉及一种具有权利要求13特征的计算机程序和一种具有权利要求14特征的计算机可读介质。
附图说明
31.本发明的进一步特征、优点和效果将通过对本发明的优选实施例的描述和附图而变得明显。图中示出:
32.图1是作为本发明的第一实施例的计算机系统的示意框图;
33.图2是本发明的第二实施例的计算机系统的示意框图。
具体实施方式
34.图1示出了作为本发明的一个实施例的计算机系统3。所述计算机系统3包括第一人工神经网络结构1和第二人工神经网络结构2。
35.第一人工神经网络结构1包括用于接收数据样本的输入端,所述数据样本被实施为图像。例如,所述图像是rgb图像。第一人工神经网络结构1是卷积人工神经网络并以多个类4对图像进行分布,据此,一部分类4是由监督学习生成或供给的并被称为监督类5。另一部分类4是由无监督学习生成或供给的并被称为无监督类6。
36.监督类5中的数据样本由人类操作者标注/标记,分布到无监督类6中的数据样本没有被标记,因此无监督类6也没有被标记/标注。为了说明这一点,想象如图1或图2所示的图像分类示例,其中,无监督算法首先将数据集拆分为n组或n类4,其中,80%(人、猫、狗、汽车)被标记,20%使用无监督学习方法分离。
37.接下来,将数据样本或可替代地将其中一个无监督类6的概率密度函数转移到第二人工神经网络结构2。第二人工神经网络结构2实施为gan或至少实施为生成式人工神经网络(如变分自编码器)。第二人工神经网络结构适用于生成人工候选对象7,其属于所述无监督类。人工候选对象7能够基于数据样本生成,或者,如果数据样本不应离开第一人工神经网络1的结构,则完全基于无监督类6的概率密度函数生成。这个步骤是随机生成新的样本,尤其是仅基于习得的概率分布。
38.在下一步中,人工候选对象7由人类操作者标记和/或标注。在这种情况下,人类标注者只看到人工生成的图像,而永远无法访问原始数据集中的各个单独的数据样本。人工候选对象7的标注/标记能够转移到无监督类,以便对无监督类进行标记和/或标注。因此,第一实施例说明了用于标记和/或标注无监督类及其整体的过程。
39.在图2中示出了另一个实施例,其中,人工候选对象7被用作第一人工神经网络结构1的输入。在这个实施例中,人工候选对象7被分类到无监督类6中,因为第二人工神经网络2适于生成这样的人工候选对象7,其属于所述无监督类6。在这种情况下,无监督类6包括原始数据样本,其没有被标记/标注,另外无监督类6还包括人工候选对象7,其是被标记/标注的,因此,无监督类6借助于一部分已分类的样本进行标记和/或标注。
40.如果第一人工神经网络1没有将人工候选对象7分类到所述无监督类6中,而是分类到另一个类4中(无论它是监督类5还是无监督类6),则错误分类的人工候选对象7能够返回到第二人工神经网络结构2,以便训练第二人工神经网络结构2的网络结构,另外,正确分类的人工候选对象7也能够返回到第二人工神经网络结构2,以便训练第二人工神经网络结构2的网络结构。在这种情况下,gan被建立起来,其中,第一人工神经网络结构1是判别器,第二人工神经网络结构2是生成器。
41.总之,本发明公开描述了一种算法,其允许使用人工生成的样本标记数据集,防止直接访问原始数据并加快数据标记过程。在数据集优选地不应离开本地/设备的场景中,这个过程也能够应用于分布式/边缘/在线学习。通过仅联合训练概率函数而不是完整算法,敏感数据能够保存在本地,而结果能够全局使用。
技术特征:
1.一种用于改进第一人工神经网络结构(1)的过程,其中,数据样本由第一人工神经网络结构(1)分类为不同的类(4),其中,至少一些类(4)是无监督类(6),所述无监督类(6)通过无监督学习生成和/或供给,其中,对于至少一个无监督类(6),训练第二人工神经网络结构(2)用来生成人工候选对象(7),所述人工候选对象(7)属于所述无监督类(6),其中,生成的人工候选对象(7)在监督学习中被标记和/或标注,用于标记和/或标注所述无监督类(6)。2.根据权利要求1所述的过程,其特征在于,所述过程是用于图像分类的过程,其中,数据样本尤其地是由至少一台监控摄像机拍摄的图像。3.根据前述权利要求之一所述的过程,其特征在于,所述第一人工网络结构(1)用已标记的和/或标注的人工候选对象(7)训练,以便标记和/或标注所述无监督类(6)。4.根据前述权利要求之一所述的过程,其特征在于,所述第一人工神经网络结构(1)是卷积人工神经网络和/或所述数据样本是图像。5.根据前述权利要求之一所述的过程,其特征在于,一部分类(4)是通过监督学习生成和/或供给的监督类(5)。6.根据前述权利要求之一所述的过程,其特征在于,所述第二人工神经网络结构(2)通过改进相应的无监督类(6)的概率密度函数的损失函数来训练。7.根据前述权利要求之一所述的过程,其特征在于,所述第二人工神经网络结构(2)包括生成式人工神经网络。8.根据权利要求7所述的过程,其特征在于,所述第二人工神经网络结构(2)包括判别式人工神经网络,其中,所述生成式和判别式人工神经网络形成生成对抗网络(gan)。9.根据权利要求7所述的过程,其特征在于,所述第一人工神经网络结构(1)被实施为判别式人工神经网络,其中,所述生成式和判别式人工神经网络形成生成对抗网络(gan)。10.根据权利要求7所述的过程,其特征在于,所述生成式人工神经网络是变分自编码器(vaes)。11.根据前述权利要求之一所述的过程,其特征在于,在所述无监督类(6)中只对人工候选对象(7)进行标记和/或标注。12.一种适于实施根据前述权利要求之一所述的过程的计算机系统(3)。13.一种计算机程序,所述计算机程序包括指令,所述指令使根据权利要求12所述的计算机系统(3)执行根据权利要求1至11之一所述的过程的步骤。14.一种计算机可读介质,所述计算机可读介质上存储有根据权利要求13所述的计算机程序。
技术总结
为了使计算机能够做出明智的决定(又名人工智能),它们必须使用某种形式的“世界模型”将原始传感器数据转换为可操作的信息。“传统”算法使用人为工程化的模型,针对手头特定的问题量身定制。这些算法在设计/训练期间通常只需要有限量的数据样本,因为适用范围窄且自由参数数量有限。公开了一种用于改进第一人工神经网络结构(1)的过程,其中,数据样本由第一人工神经网络结构(1)分类为不同的类(4),其中,至少一些类(4)是无监督类(6),所述无监督类(6)由无监督学习生成和/或供给,其中,对于至少一个无监督类(6),训练第二人工神经网络结构(2)用来生成人工候选对象(7),所述人工候选对象(7)属于所述无监督类(6),其中,生成的人工候选对象(7)在监督学习中被标记和/或标注,用于标记和/或标注所述无监督类(7)。用于标记和/或标注所述无监督类(7)。用于标记和/或标注所述无监督类(7)。
技术研发人员:M
受保护的技术使用者:罗伯特
技术研发日:2020.12.02
技术公布日:2023/10/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:整个身体视觉效果的制作方法 下一篇:食用菌培养袋放置架的制作方法