一种模块化神经网络机器翻译模型及人在闭环交互式人工智能辅助翻译系统、方法与流程

未命名 10-20 阅读:62 评论:0
1.本发明属于机器翻译
技术领域
:,具体的说,是涉及一种模块化神经网络机器翻译模型及人在闭环交互式人工智能辅助翻译系统、方法。
背景技术
::2.目前,机翻和机器辅助翻译系统已经取得了很大的进步,虽然它们仍然不能完全取代人类翻译,但可以提供快速和基本准确的翻译,并且在许多情况下可以作为人类翻译的有用补充。随着技术的进步,机翻和机器辅助翻译系统也在不断提高,它们能够处理更复杂的语言结构,并且在翻译质量和准确性方面也有所提高。3.现有技术中,以mt+pe的翻译模式为主流,其是指人机联合翻译machinetranslation+post-editing模式,工作原理是:机器翻译系统首先将文本翻译成目标语言,然后,人类翻译员在根据机器翻译结果进行后期编辑,以消除机器翻译系统翻译出来的文本中的错误和不通顺的地方。mt+pe的翻译模式的优点在于:能够提高翻译效率,并且机器翻译的结果可以作为人工审核的基础,避免了人工审核从头开始翻译的情况,但是,该翻译模式仍然存在以下的不足:(1)传统的机器翻译无法通过人工译员的提示对机器翻译输出译文结果进行有效干预,导致人工译员仍然需要很大的工作量对机器翻译的结果进行审核校对;(2)人机结合的结合度较差,人工译员与机器的工作之间相互割裂,机器翻译给出一个初步的机器翻译结果后,与人工译员之间没有智能交互,没有充分发挥人工智能的辅助优势。技术实现要素:4.本发明的目的在于提供一种人在闭环交互式人工智能辅助翻译系统,以解决现有技术所存在的技术问题。5.为了实现上述目的,本发明采取的技术方案如下:6.一种模块化神经网络机器翻译模型,包括:7.知识选择模块,根据输入文本,从外部知识库中选择翻译时需要的内部知识;8.模型选择模块,根据输入文本的特征选择模型库中对应的子模型参与任务的推理;9.知识融合模块,将选择的内部知识采用融合方式融入到文本的表示中。10.在一种实施方案中,所述内部知识包括句法知识、语义知识、翻译规则知识。11.在一种实施方案中,所述知识融合模块的融合方式如下:首先将内部知识转化为词向量,再与待翻译的原文词向量进行拼接。12.在一种实施方案中,所述输入文本的特征包括输入词的频率、词性以及类化语义。13.为了实现上述目的,本发明还提供了一种人在闭环交互式人工智能辅助翻译系统,包括:14.如上所述的模块化神经网络机器翻译模型,根据源语言输入,融合人类提示,输出目标语言翻译;15.提示训练集构建模块,构建用于模块化神经网络机器翻译模型训练的提示训练集;16.交互提示模块,用于向模块化神经网络机器翻译模型输入人类提示;17.提示评估模块,用于评估和优化人类提示。18.在一种实施方案中,所述提示训练集包括提示正样本和提示负样本,其中,提示正样本包括片段翻译提示、受限翻译提示和翻译调序提示。19.在一种实施方案中,所述的人类提示包括:提示词、短语、短句或者预定义提示信息。20.为了实现上述目的,本发明还提供了一种人在闭环交互式人工智能辅助翻译方法,首先,构建如上所述的模块化神经网络机器翻译模型和提示训练集,并完成对模块化神经网络机器翻译模型的训练,然后,执行以下步骤:21.(1)输入源语言文本;22.(2)知识选择:在外部知识库中选择翻译时需要的内部知识;23.(3)模型选择:根据输入源语言文本的特征,选择模型库中对应的子模型参与任务的推理;24.(4)知识融合:通过知识选择和模型选择计算的语义向量经过知识融合输出机翻译文;25.(5)翻译人员根据机翻译文,给出人类提示,并反馈至模块化神经网络机器翻译模型;26.(6)根据所述(5)中的人类提示,再次执行步骤(2)~(4),输出机翻译文;27.(7)重复执行所述(5)~(6),直至得到翻译人员满意的机翻译文。28.在一种实施方案中,所述(4)中的知识融合的具体方式如下:将选择的内部知识编码,编码完成后,将编码过的内部知识融入到源语言文本的表示中。29.在一种实施方案中,所述模块化神经网络机器翻译模型的训练的方式包括:30.人在回路的模型持续学习:翻译人员在校对机器翻译输出的过程中指出机器翻译的错误,并提示给模块化神经网络机器翻译模型;31.人在回路的模型主动学习:模块化神经网络机器翻译模型对翻译质量进行评估,选择不确定性最大的翻译结果输出给翻译人员,翻译人员指出机器翻译的错误,并提示给模块化神经网络机器翻译模型。32.与现有技术相比,本发明具备以下有益效果:33.本发明采用模块化神经网络机器翻译模型,显示建模语义知识,提升机翻的可解释性和可干预性,并基于该模块化神经网络机器翻译模型构建人在闭环人工智能辅助翻译系统、方法,翻译人员pe的过程中,模型可以与翻译人员进行交互,根据翻译人员的提示修改机翻译文。实现对机翻译文的有效干预,人工译员与机器的工作之间形成智能交互,不仅人机结合的结合度较优,而且减少了翻译人员手动编辑的工作量,提高工作效率。附图说明34.图1为本发明-实施例1中模块化神经网络机器翻译模型的模型架构。35.图2为本发明-实施例2中人在闭环人工智能辅助翻译系统的原理示意图。具体实施方式36.为了使得本领域技术人员对本发明有更清晰的认知和了解,以下结合实施例对本发明进行进一步的详细说明。应当知晓的,下述所描述的具体实施例只是用于解释本发明,方便理解,本发明所提供的技术方案并不局限于下述实施例所提供的技术方案,实施例所提供的技术方案也不应当限制本发明的保护范围。37.需要说明的是,以下实施例中所提供的图示仅以示意方式说明本发明的基本构想,故图式中仅显示与本发明中有关的组件而非按照实际实施时的组件数目、形状及尺寸绘制,其实际实施时各组件的型态、数量及比例可为一种随意的改变,且其组件布局型态也可能更为复杂。38.实施例139.如图1所示,本实施例提供了一种一种模块化神经网络机器翻译模型,其实现可以作为现在神经网络框架的自然延展,使用离散结构可微化或强化学习,甚至门结构来实现,具体包括:40.知识选择模块,根据输入文本,从外部知识库中选择翻译时需要的内部知识;其中,内部知识包括句法知识、语义知识、翻译规则知识,知识选择模块包括句法规则模块、语义规则模块、翻译规则模块等。例如:给定文本为“我今天很开心”,根据句法知识,句法规则模块会解析为简单句主谓结构和时态信息,语义规则模块可以从语义知识模块中检索“开心”的同义词“高兴”、“喜悦”等同义词,从翻译规则模块找到“开心”的常用翻译“happy”,“up”,辅助生成翻译“iamhappytoday”。41.模型选择模块,根据输入文本的特征选择模型库中对应的子模型参与任务的推理,其中,输入文本的特征包括输入词的频率、词性以及类化语义;具体的说,根据输入词的频率,词性以及类化语义,动态地选择部分注意力层和前馈层,或者选择注意力层中的特定头参与当前实例的翻译。例如:对于高频词和低频词,模型可以选择不同的神经网络参数进行编码,在相应的训练过程之中,模型可以根据不同频率的训练程度,及时的停止不同模块的参数更新,从而使低频词得到充分训练,并且不破坏高频词的编码效果;对于极低频词,可以根据它的类化语义,选择模型中特定的、专门的参数进行推理,这部分参数在训练时不会受到其他海量数据的影响,从而避免了灾难性遗忘对低频词知识的冲击。除了词的频率之外,对于不同的句法类型、不同的语义原型,以及不同的输出任务特点,均可以采用模块化的动态神经网络进行处理。42.知识融合模块,将选择的内部知识采用融合方式融入到文本的表示中,其中,融合方式为:首先,内部知识是以文本的形式,通过wordembedding(词向量)层转化为一组词向量,输入模型时与待翻译的原文词向量拼接后一同输入模型。43.实施例244.如图2所示,本实施例提供了一种人在闭环交互式人工智能辅助翻译系统,包括:45.实施例1所提供的模块化神经网络机器翻译模型,根据源语言输入,融合人类提示,输出目标语言翻译;46.提示训练集构建模块,构建用于模块化神经网络机器翻译模型训练的提示训练集;其中,提示训练集包括提示正样本和提示负样本,其中,提示正样本包括片段翻译提示、受限翻译提示和翻译调序提示;47.交互提示模块,用于向模块化神经网络机器翻译模型输入人类提示;其中,人类提示包括:提示词、短语、短句或者预定义提示信息,翻译人员通过提示词、短语、短句或者预定义提示信息与机器翻译系统进行智能交互。48.提示评估模块,用于评估和优化人类提示。虽然,在机器翻译过程中,人类提示的作用是至关重要的,它可以有效地指导机器翻译模型生成更准确、更自然的翻译结果,但是,并非所有的人类提示都会产生积极的效果,一些提示可能会误导模型,从而降低翻译的质量。提示评估模块会对每一条人类提示进行评估,以确定其对翻译结果的影响是积极的还是消极的。49.需要说明的是,应理解以上系统的各个模块的划分仅仅是一种逻辑功能的划分,实际实现时可以全部或部分集成到一个物理实体上,也可以物理上分开,且这些模块可以全部以软件通过处理元件调用的形式实现;也可以全部以硬件的形式实现;还可以部分模块通过处理元件调用软件的形式实现,部分模块通过硬件的形式实现。例如,某模块可以为单独设立的处理元件,也可以集成在装置的某一个芯片中实现,此外,也可以以程序代码的形式存储于装置的存储器中,由上述装置的某一个处理元件调用并执行某模块的功能,其它模块的实现与之类似。此外这些模块全部或部分可以集成在一起,也可以独立实现。这里所述的处理元件可以是一种集成电路,具有信号的处理能力。在实现过程中,上述方法的各步骤或以上各个模块可以通过处理器元件中的硬件的集成逻辑电路或者软件形式的指令完成。50.例如,以上这些模块可以是被配置成实施以上方法的一个或多个集成电路,例如:一个或多个特定集成电路,或,一个或多个微处理器,或,一个或者多个现场可编程门阵列等。再如,当以上某个模块通过处理元件调度程序代码的形式实现时,该处理元件可以是通用处理器,例如中央处理器或其它可以调用程序代码的处理器。再如,这些模块可以集成在一起,以片上系统的形式实现。51.实施例352.本实施例提供了一种人在闭环交互式人工智能辅助翻译方法,首先,构建如实施例1所提供的模块化神经网络机器翻译模型和提示训练集,并完成对模块化神经网络机器翻译模型的训练,然后,执行以下步骤:53.(1)输入源语言文本,例如:昨天我吃了桌子上的苹果派;54.(2)知识选择:在外部知识库中选择翻译时需要的内部知识,其中的内部知识包括句法知识、语义知识、翻译规则知识;具体的说,在外部知识库中通过检索方式检索出相关的内部知识,如单词或者短语的译法,例如:苹果派-》applepie;55.(3)模型选择:根据输入源语言文本的特征,选择模型库中对应的子模型参与任务的推理,其中,源语言文本的特征包括输入词的频率、词性以及类化语义;具体的说,模型选择是动态地选择部分注意力层和前馈层,或者选择注意力层中的特定头参与当前实例的翻译;56.(4)知识融合:通过知识选择和模型选择计算的语义向量经过知识融合输出机翻译文,该步骤所得机翻译文为初步机翻译文;例如:昨天,我吃了桌子上的苹果派,输出机翻译文:yesterday,iatetheapplepieonthetable;其中,知识融合的具体方式如下:将选择的内部知识编码,编码完成后,将编码过的内部知识融入到源语言文本的表示中,这个过程可以通过多种方式完成,例如:可以采用注意力机制来决定不同知识的重要程度并相应地融合;或者,利用自注意力机制来进行编码的知识与源语言文本的交互,从而获得更丰富的源语言文本表示;57.(5)翻译人员根据机翻译文,给出人类提示,并反馈至模块化神经网络机器翻译模型,其中,人类提示包括提示词、短语、短句或者预定义提示信息;例如:“使用desk而不是table翻译桌子”;58.(6)根据(5)中的人类提示,再次执行步骤(2)~(4),输出机翻译文;例如:根据(4)中的“yesterday,iatetheapplepieonthetable”和(5)中的“使用desk而不是table翻译桌子”,则机翻译文修改为“yesterday,iatetheapplepieonthedesk”,该步骤所得机翻译文为二次机翻译文,若翻译人员满意该机翻译文,则完成翻译;59.(7)重复执行(5)~(6),直至得到翻译人员满意的机翻译文;例如:在二次机翻译文的基础上,翻译人员进一步给出人类提示:翻译成被动句式,则在二次机翻译文的基础上,输出yesterday,theapplepiewaseatenbyme。60.本实施例中,模块化神经网络机器翻译模型的训练的方式包括(在模型的训练过程中,可以选择下述第1种或第2种或二者结合的训练方式):61.1.人在回路的模型持续学习:翻译人员在校对机器翻译输出的过程中指出机器翻译的错误,并提示给模块化神经网络机器翻译模型,相比传统训练方式,这种基于人类反馈的模型训练更加有的放矢,允许模型有针对性的改进自身弱点;62.人在回路的模型持续学习的具体方式如下:翻译人员接收到机器翻译的文本并进行校对。在校对过程中,翻译人员标注出机器翻译的错误并给出更好的翻译或提示;这些标注和提示将被反馈给模块化神经网络机器翻译模型,模型根据这些信息进行更新和学习。63.2.人在回路的模型主动学习:模块化神经网络机器翻译模型对翻译质量进行评估,选择不确定性最大的翻译结果输出给翻译人员,翻译人员指出机器翻译的错误,并提示给模块化神经网络机器翻译模型,相比传统训练方式,人机结合的机器翻译训练可以根据模型所犯的错误,有针对性地收集人类反馈。64.人在回路的模型主动学习的具体方式如下:首先,模块化神经网络机器翻译模型首先对其自身的翻译结果进行评估,计算出每个翻译结果的不确定性或置信度;然后,模型会选择不确定性最大(也就是自身最不确定或者最需要帮助的)的翻译结果,输出给翻译人员进行校对;翻译人员接收到模型的输出,找出翻译错误并给出提示;这些错误和提示将被反馈给模块化神经网络机器翻译模型,模型将根据这些信息进行更新和学习。这种方式能使模型主动寻求改进,自我评估并利用人类的反馈来学习和提高,能帮助模型更有效地提高翻译质量,尤其是在处理模型自身不擅长或不确定的情况时。65.上述的提示可以是某个翻译错误的输入单词、翻译不对的序列或者正确的片段翻译;通过上述的机器翻译训练方式可以大幅减小完整翻译数据的标注成本,实现模型高效率持续学习。66.实施例467.本实施例提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行,以实现实施例3所提供的人在闭环交互式人工智能辅助翻译方法。本领域技术人员可以理解:实现实施例3所提供方法的全部或部分步骤可以通过计算机程序相关的硬件来完成,上述的计算机程序可以存储于一计算机可读存储介质中,该程序在执行时,执行包括实施例3所提供方法的步骤;而上述的存储介质包括:rom、ram、磁碟或者光盘等各种可以存储程序代码的介质。68.以上所述即为本发明的优选实施方案。应当说明的是,本领域技术人员,在不脱离本发明的设计原理及技术方案的前提下,还可以作出若干的改进,而这些改进也应当视为本发明的保护范围。当前第1页12当前第1页12
技术特征:
1.一种模块化神经网络机器翻译模型,其特征在于,包括:知识选择模块,根据输入文本,从外部知识库中选择翻译时需要的内部知识;模型选择模块,根据输入文本的特征选择模型库中对应的子模型参与任务的推理;知识融合模块,将选择的内部知识采用融合方式融入到文本的表示中。2.根据权利要求1所述的人在闭环交互式人工智能辅助翻译系统,其特征在于:所述内部知识包括句法知识、语义知识、翻译规则知识。3.根据权利要求2所述的人在闭环交互式人工智能辅助翻译系统,其特征在于:所述知识融合模块的融合方式如下:首先将内部知识转化为词向量,再与待翻译的原文词向量进行拼接。4.根据权利要求3所述的人在闭环交互式人工智能辅助翻译系统,其特征在于:所述输入文本的特征包括输入词的频率、词性以及类化语义。5.一种人在闭环交互式人工智能辅助翻译系统,其特征在于,包括:如权利要求1~4任一项所述的模块化神经网络机器翻译模型,根据源语言输入,融合人类提示,输出目标语言翻译;提示训练集构建模块,构建用于模块化神经网络机器翻译模型训练的提示训练集;交互提示模块,用于向模块化神经网络机器翻译模型输入人类提示;提示评估模块,用于评估和优化人类提示。6.根据权利要求5所述的人在闭环交互式人工智能辅助翻译系统,其特征在于:所述提示训练集包括提示正样本和提示负样本,其中,提示正样本包括片段翻译提示、受限翻译提示和翻译调序提示。7.根据权利要求6所述的人在闭环交互式人工智能辅助翻译系统,其特征在于:所述的人类提示包括:提示词、短语、短句或者预定义提示信息。8.一种人在闭环交互式人工智能辅助翻译方法,其特征在于,首先,构建如权利要求1~4任一项所述的模块化神经网络机器翻译模型和提示训练集,并完成对模块化神经网络机器翻译模型的训练,然后,执行以下步骤:(1)输入源语言文本;(2)知识选择:在外部知识库中选择翻译时需要的内部知识;(3)模型选择:根据输入源语言文本的特征,选择模型库中对应的子模型参与任务的推理;(4)知识融合:通过知识选择和模型选择计算的语义向量经过知识融合输出机翻译文;(5)翻译人员根据机翻译文,给出人类提示,并反馈至模块化神经网络机器翻译模型;(6)根据所述(5)中的人类提示,再次执行步骤(2)~(4),输出机翻译文;(7)重复执行所述(5)~(6),直至得到翻译人员满意的机翻译文。9.根据权利要求8所述的人在闭环交互式人工智能辅助翻译方法,其特征在于,所述(4)中的知识融合的具体方式如下:将选择的内部知识编码,编码完成后,将编码过的内部知识融入到源语言文本的表示中。10.根据权利要求8所述的人在闭环交互式人工智能辅助翻译方法,其特征在于,所述模块化神经网络机器翻译模型的训练的方式包括:人在回路的模型持续学习:翻译人员在校对机器翻译输出的过程中指出机器翻译的错
误,并提示给模块化神经网络机器翻译模型;人在回路的模型主动学习:模块化神经网络机器翻译模型对翻译质量进行评估,选择不确定性最大的翻译结果输出给翻译人员,翻译人员指出机器翻译的错误,并提示给模块化神经网络机器翻译模型。

技术总结
本发明属于机器翻译技术领域,提供了一种模块化神经网络机器翻译模型及人在闭环交互式人工智能辅助翻译系统、方法,其中,人在闭环交互式人工智能辅助翻译系统包括块化神经网络机器翻译模型,根据源语言输入,融合人类提示,输出目标语言翻译;提示训练集构建模块,构建用于模块化神经网络机器翻译模型训练的提示训练集;交互提示模块,用于向模块化神经网络机器翻译模型输入人类提示;提示评估模块。本发明采用模块化神经网络机器翻译模型,显示建模语义知识,提升机翻的可解释性和可干预性,实现对机翻译文的有效干预,人工译员与机器的工作之间形成智能交互,不仅人机结合的结合度较优,而且减少了翻译人员手动编辑的工作量,提高工作效率。提高工作效率。提高工作效率。


技术研发人员:朱宪超 韩冰
受保护的技术使用者:四川语言桥信息技术有限公司
技术研发日:2023.07.17
技术公布日:2023/10/8
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐