基于语音处理的辩论机器人的控制方法、装置、介质
未命名
09-23
阅读:36
评论:0
1.本发明涉及人工智能技术领域,具体地,涉及一种基于语音处理的辩论机器人的控制方法、装置、介质及基于语音处理的辩论机器人系统。
背景技术:
2.大学生参加大学生辩论赛能够提高口才表达能力,在辩论赛中,辩手能够清晰准确有条理地表达自己的观点和论据,对于学生的未来职业发展和人机交往均具有重大意义,同时,辩论赛还能够提高思维逻辑能力、分析问题能力以及辩证思考的能力,有助于培养学生的团队合作和领导能力。辩论赛的课题涉及各种学科领域,能够增加学生的知识储备,拓宽视野,提高综合素质。
3.但是,练习辩论需要多个学生组合练习,一旦有学生缺席练习,影响辩论训练效率。现如今,随着人工智能技术的进步,机器人成为现代人们生活中不可或缺的存在,而在辩论领域,采用辩论机器人以进行辩论训练或者辩论比赛都已成为迫切的需求。
技术实现要素:
4.针对现有技术中的缺陷,本公开的目的是提供一种基于语音处理的辩论机器人的控制方法、装置、介质及基于语音处理的辩论机器人系统。
5.根据本发明的第一方面,提供一种基于基于语音处理的辩论机器人的控制方法,包括:
6.获取辩论物料训练集;
7.将所述辩论物料训练集输入预设训练模型中,控制所述辩论机器人学习辩论物料,所述预设训练模型包括低秩适配器,所述低秩适配器用于对所述预设训练模型进行优化处理;
8.将预设的辩论场景、所述预设的辩论场景对应的辩论时长以及辩论机器人的辩手角色输入所述辩论机器人中;
9.根据所述预设的辩论场景和所述辩论场景的语音信息,控制所述辩论机器人在所述预设的辩论场景对应的辩论时长内输出目标辩论语言。
10.可选地,所述根据所述预设的辩论场景和所述辩论场景的语音信息,控制所述辩论机器人在所述预设的辩论场景对应的辩论时长内输出目标辩论语言,包括:
11.通过与所述辩论机器人连接的麦克风接口,获取所述辩论场景的语音信息;
12.根据所述麦克风接口的编号,确定所述麦克风接口对应的发言辩手在所述辩论场景的语音信息;
13.将所述发言辩手在所述辩论场景的语音信息输入语音识别模型中,确定所述辩论场景的语音文本信息;
14.将所述预设的辩论场景和所述辩论场景的语音文本信息输入语言文本生成模型中,确定目标辩论语言文本;
15.将所述目标辩论语言文本输入语音播报模型中,确定目标辩论语言,控制所述辩论机器人输出所述目标辩论语言。
16.可选地,所述将所述目标辩论语言文本输入语音播报模型中,确定目标辩论语言,控制所述辩论机器人输出所述目标辩论语言,包括:
17.根据所述辩论机器人的辩手角色,确定具有所述辩手角色对应语调的目标辩论语言,控制所述机器人以所述辩手角色对应语调输出所述目标辩论语言。
18.可选地,所述方法还包括:
19.根据辩论题目要求文本,确定辩论立场,所述辩论立场包括正面立场和反面立场;
20.将所述辩论题目要求文本和所述辩论立场输入语言文本生成模型中,控制所述辩论机器人理解所述辩论场景的语音信息。
21.可选地,所述将所述预设的辩论场景和所述辩论场景的语音文本信息输入语言文本生成模型中,确定目标辩论语言文本,包括:
22.若所述辩论机器人处于预设的辩论场景的立论环节,将所述立论环节输入所述语言文本生成模型中,确定第一目标辩论语言文本;
23.若所述辩论机器人处于预设的辩论场景的交锋环节,将所述交锋环节和所述辩论场景的语音文本信息输入语言文本生成模型中,确定第二目标辩论语言文本;
24.若所述辩论机器人处于预设的辩论场景的自由辩论环节,将所述自由辩论环节和所述自由辩论环节中的初始发言辩手的语音文本信息输入语言文本生成模型中,确定第三目标辩论语言文本。
25.可选地,所述方法还包括:
26.通过计时的方式和/或触发预设关键字的方式和/或用户输入的方式,控制所述辩论机器人识别所处的预设的辩论场景的环节。
27.可选地,所述方法还包括:
28.所述辩论机器人存储所述预设的辩论场景的语音信息。
29.根据本公开的第二方面,提供一种基于语音处理的辩论机器人的控制装置,包括:
30.获取模块,用于获取辩论物料训练集;
31.训练模块,用于将所述辩论物料训练集输入预设训练模型中,控制所述辩论机器人学习辩论物料,所述预设训练模型包括低秩适配器,所述低秩适配器用于对所述预设训练模型进行优化处理;
32.输入模块,用于将预设的辩论场景、所述预设的辩论场景对应的辩论时长以及辩论机器人的分饰角色输入所述辩论机器人中;
33.控制模块,用于根据所述预设的辩论场景和所述辩论场景的语音信息,控制所述辩论机器人在所述预设的辩论场景对应的辩论时长内输出目标辩论语言。
34.根据本公开的第三方面,提供一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现本公开第一方面提供的所述方法的步骤
35.根据本公开的第四方面,提供一种,基于语音处理的辩论机器人系统,包括:
36.语音识别模块,所述语音识别模块与麦克风连接,所述语音识别模块用于识别每一发言辩手的语音信息,将所述每一发言辩手的语音信息转化为语音文本信息;
37.语言文本生成模块,所述语言文本生成模块与语音识别模块连接,所述语言文本生成模块用于理解辩论场景的信息并生成目标辩论语言文本;
38.语音播报模块,所述语音播报模块与所述语言文本生成模块连接,所述语音播报模块用于将目标辩论语言文本转化为目标辩论语言。
39.与现有技术相比,本发明实施例具有如下至少一种有益效果:
40.通过上述技术方案,通过将辩论物料训练集输入预设训练模型中,通过低秩适配器进行模型训练,预设训练机器人获取辩论物料知识,从而控制辩论机器人学习辩论物料,加强辩论机器人在辩论领域的垂直深度,并采用低秩适配器,减少训练参数量,提高预设训练模型的训练效率;将预设的辩论场景、预设的辩论场景对应的辩论时长以及辩论机器人的辩手角色输入辩论机器人中,并根据预设的辩论场景和辩论场景的语音信息,控制辩论机器人输出目标辩论语言,生成机器人辩手,并形成真实的辩论过程,为人类辩手提供陪练功能,以提高人类辩手的辩论能力和辩论技巧。
附图说明
41.通过阅读参照以下附图对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
42.图1是根据一示例性实施例示出的一种基于语音处理的辩论机器人的控制方法的流程图。
43.图2是根据一示例性实施例示出的一种控制辩论机器人输出目标辩论语言的方法的流程图。
44.图3是根据一示例性实施例示出的一种基于语音处理的辩论机器人的控制装置的框图。
45.图4是根据一示例性实施例示出的一种基于语音处理的辩论机器人系统的框图。
具体实施方式
46.下面结合具体实施例对本发明进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本发明,但不以任何形式限制本发明。应当指出的是,对本领域的普通技术人员来说,在不脱离本发明构思的前提下,还可以做出若干变形和改进。这些都属于本发明的保护范围。
47.辩论机器人可以应用于各行业各举行的辩论比赛中或者辩论训练中,可以进行人际辩论、作为人类辩手的陪练以及机器人与机器人之间的辩论。
48.图1是根据一示例性实施例示出的一种基于语音处理的辩论机器人的控制方法的流程图。如图1所示,一种基于语音处理的辩论机器人的控制方法,包括s11至s14。
49.s11,获取辩论物料训练集。
50.根据辩论场景和辩论题目,用户收集与辩论场景和辩论题目有关的专业信息资料,并将其资料整理为辩论物料训练集。
51.s12,将辩论物料训练集输入预设训练模型中,控制辩论机器人学习辩论物料,预设训练模型包括低秩适配器,低秩适配器用于对预设训练模型进行优化处理。
52.其中,通过低秩适配器对预设训练模型进行优化处理,采用矩阵的svd秩分解矩阵
降低预设训练模型进行模型训练的参数量,并冻结预设训练模型的原有的权重矩阵,使得预设训练模型减少在根据辩论物料训练集进行模型训练时所需要的内存和计算量,可以达到原始方法的1/1000-1/10000。
53.示例地,预设训练模型的神经网络中包括多个密集层,密集层中的权重矩阵为全秩,密集层用于执行矩阵乘法。在通过低秩适配器对预设训练模型进行优化处理时,预设训练模型具有较低的“维度”,可以投影至较小的子空间进行有效学习。
54.设预设训练模型的权重矩阵为w0∈rd×k,采用低秩分解w0+δw=w0+ba表示其更新,其中,b∈rd×r,a∈rr×k,秩r《=min(d,k)。
55.在对预设训练模型进行训练过程中,w0被冻结,不进行梯度更新,a和b中包含可训练参数。w0和δw=ba都是采用相同的输入进行乘积运算,再将各自的输出向量根据坐标进行求和处理。
56.对a进行随机高斯初始化,对b进行零初始化,则δw=ba在训练开始时为0。在适应过程中无需对权重矩阵进行累积梯度更新获取全秩。当增加可训练参数数量时,训练lora收敛于原始的预设训练模型,并基于低秩适配器收敛于mlp,并基于前缀的方法收敛于无法接受长输入序列的模型。在训练过程中,可以显式地计算并存储w=w0+ba,并执行推理。其中w0和ba均在rd×k中,以在推理过程中无额外延迟。
57.在上述技术方案中,通过低秩适配器对预设训练模型进行优化处理,经过模型训练后的预设训练模型具有与辩论专业知识,辩论机器人包括预设训练模型,从而辩论机器人可以掌握辩论专业知识。
58.s13,将预设的辩论场景、预设的辩论场景对应的辩论时长以及辩论机器人的辩手角色输入辩论机器人中。
59.其中,辩论机器人支持传统的辩论场景和辩论流程,也可以支持个性化设置的辩论场景及辩论流程。
60.传统的辩论场景包括:立论环节、交锋环节、小结环节、自由辩环节、总结环节。另一种传统的辩论场景包括:立论环节、自由辩环节、总结环节、点评环节。
61.在一种可能的实施例中,预设的辩论场景对应的辩论时长包括预设辩论场景的总时长以及各个环节的时长。
62.在本公开中,辩论机器人可以支持不少于四个辩手角色的设定以及不少于四个辩手角色的管理。
63.s14,根据预设的辩论场景和辩论场景的语音信息,控制辩论机器人在预设的辩论场景对应的辩论时长内输出目标辩论语言。
64.辩论机器人的内部设置有语言文本生成模型,其中,语言文本生成模型可以采用chatgpt模型、百度的“文心一言”模型、gpt4.0模型、科大讯飞模型。
65.在另一种可能的实施例中,语言文本生成模型还可以采用专门训练的应用于辩论的自然语言文本生成模型。
66.辩论机器人采用的语言文本生成模型可以采用上述的一种模型或者多种模型组合的形式。
67.通过上述技术方案,通过将辩论物料训练集输入预设训练模型中,通过低秩适配器进行模型训练,预设训练机器人获取辩论物料知识,从而控制辩论机器人学习辩论物料,
加强辩论机器人在辩论领域的垂直深度,并采用低秩适配器,减少训练参数量,提高预设训练模型的训练效率;将预设的辩论场景、预设的辩论场景对应的辩论时长以及辩论机器人的辩手角色输入辩论机器人中,并根据预设的辩论场景和辩论场景的语音信息,控制辩论机器人输出目标辩论语言,生成机器人辩手,并形成真实的辩论过程,为人类辩手提供陪练功能,以提高人类辩手的辩论能力和辩论技巧。
68.图2是根据一示例性实施例示出的一种控制辩论机器人输出目标辩论语言的方法的流程图。如图2所示,在一些可能的实施例中,根据预设的辩论场景和辩论场景的语音信息,控制辩论机器人在预设的辩论场景对应的辩论时长内输出目标辩论语言,包括s21至s25。
69.s21,通过与辩论机器人连接的麦克风接口,获取辩论场景的语音信息。
70.s22,根据麦克风接口的编号,确定麦克风接口对应的发言辩手在辩论场景的语音信息。
71.在一种可能的实施例中,将辩论机器人与每一人类辩手的麦克风连接,并将麦克风接口进行编号,以定位每一人类辩手,通过麦克风接口获取每一人类辩手的语音信息。
72.s23,将发言辩手在辩论场景的语音信息输入语音识别模型中,确定辩论场景的语音文本信息。
73.将每一人类辩手的语音信息结合麦克风通道标签(麦克风接口编号)输入辩论机器人的系统的语音识别模型中,当同一时刻具有多个麦克风通道的声音输入时,确定出现语音信息最早的麦克风通道,从而确定发言辩手,并将其他麦克风通道的语音信息进行屏蔽,以避免辩手语音信息冲突,提高语音识别率。
74.在语音识别模型中设置智能语音输入法,例如,百度输入法、讯飞输入法、华为输入法、微软输入法,辩论机器人的系统支持各种语音输入,根据接入的麦克风的api接口进行语音的自动识别,以对通过麦克风接口获取的每一人类辩手的语音信息进行自动识别,并将每一人类辩手的语音信息转化为语音文本信息。
75.s24,将预设的辩论场景和辩论场景的语音文本信息输入语言文本生成模型中,确定目标辩论语言文本。
76.其中,在语音文本信息上标记麦克风通道标签,确定该语音文本信息的发言辩手,语言文本生成模型还具有语言文本理解功能,理解输入的语音文本信息,并生成具有针对性的目标辩论语言文本。
77.s25,将目标辩论语言文本输入语音播报模型中,确定目标辩论语言,控制辩论机器人输出目标辩论语言。
78.在一些可能的实施例中,根据辩论机器人的辩手角色,确定具有辩手角色对应语调的目标辩论语言,控制机器人以辩手角色对应语调输出目标辩论语言。
79.辩手角色对应的语调包括辩手角色的音色和语言风格。
80.其中,语音播报模型可以采用tts语音播报系统,在语音播报模型中设定辩论机器人的每一辩手角色的音色和语言风格,以生成具有不同语调的目标辩论语言。
81.示例地,设定机器人辩手角色的音色为男生音色或者女生音色,一辩选手、二辩选手、三辩选手以及四辩选手的语音风格可以设置为诙谐幽默、娓娓道来、慷慨激昂、具有亲和力、平铺直叙等风格。
82.通过上述设定,辩论机器人通过所设定的辩论角色的音色和语言风格输出目标辩论语言。
83.在另一种可能的实施例中,还可以根据英语辅音和元音的目标风格动画,生成音节、单词和句子的动画。
84.通过上述技术方案,可以定位发言的人类辩手,提高语音识别的准确度,设置辩论机器人的音色和语言风格,可以提升辩论机器人的辩论效果。
85.在一些可能的实施例中,所述方法还包括s15、s16。
86.s15,根据辩论题目要求文本,确定辩论立场,辩论立场包括正面立场和反面立场。
87.其中,正面立场表示赞同辩论题目立场,反面立场表示反驳辩论题目的立场。
88.s16,将辩论题目要求文本和辩论立场输入语言文本生成模型中,控制辩论机器人理解辩论场景的语音信息。
89.在语言文本生成模型中设置transformer自然语言理解模型,transformer自然语言理解模型具有理解功能,用于辩论机器人理解辩论题目要求文本所表达的含义、辩论立场以及辩论场景中的语音信息所表达的含义。
90.若辩论机器人的辩论立场为正面立场,则根据预设的辩论场景,语言文本生成模型理解辩论场景的语音信息并生成支持性的目标辩论语言文本;若辩论机器人的辩论立场为反面立场,则根据预设的辩论场景,语言文本生成模型理解辩论场景的语音信息并生成反驳性的目标辩论语言文本。
91.通过上述技术方案,在语言文本生成模型中添加transformer自然语言理解模型,控制辩论机器人具有理解能力,提高辩论机器人的灵活性,进而提升人类辩手的体验感。
92.在一些可能的实施例中,将预设的辩论场景和辩论场景的语音文本信息输入语言文本生成模型中,确定目标辩论语言文本,包括:
93.若辩论机器人处于预设的辩论场景的立论环节,将立论环节输入语言文本生成模型中,确定第一目标辩论语言文本。
94.其中,第一目标辩论语言文本表示观点陈述的语言文本,将辩论场景的立论环节输入辩论机器人中,触发辩论机器人的语言文本生成模型理解辩论题目并生成第一目标辩论语言文本表达对当前辩论题目所表示的观点的理解。
95.若辩论机器人处于预设的辩论场景的交锋环节,将交锋环节和辩论场景的语音文本信息输入语言文本生成模型中,确定第二目标辩论语言文本。
96.其中,第二目标辩论语言文本表示辩论机器人所代表的每一辩手角色根据辩论题目要求所发表的不同观点。将辩论场景的交锋环节输入辩论机器人中,触发辩论机器人的语言文本生成模型理解辩论题目和辩论场景的语音文本信息并生成第二目标辩论语言文本表达不同观点。示例地,辩论机器人可以表示一辩、二辩、三辩或者四辩,辩论机器人根据辩手角色表达不同观点。
97.若辩论机器人处于预设的辩论场景的自由辩论环节,将自由辩论环节和自由辩论环节中的初始发言辩手的语音文本信息输入语言文本生成模型中,确定第三目标辩论语言文本。
98.其中,第三目标辩论语言文本表示辩论机器人根据对方辩手的语音文本信息生成的观点语言文本。将辩论场景的自由辩环节输入辩论机器人中,触发辩论机器人的语言文
本生成模型理解对方辩手的语音文本生成信息并生成第三目标辩论语言表达辩论机器人所代表的立场的观点语言文本。
99.在一种可能的实施例中,在自由辩环节,根据麦克风的麦克风通道标签以及麦克风的接口编号,确定初始发言辩手的语音文本信息,防止输入冲突。
100.在一些可能的实施例中,所述方法还包括:
101.通过计时的方式和/或触发预设关键字的方式和/或用户输入的方式,控制辩论机器人识别所处的预设的辩论场景的环节。
102.作为一示例,可以根据辩论赛的计时时长,控制辩论机器人判断当前所处的辩论场景的环节。
103.作为另一示例,还可以捕捉当前辩论过程中的关键词,根据所捕捉的关键词是否触发预设关键词,控制辩论机器人判断当前所处的辩论场景的环节。
104.作为另一示例,还可以通过用户输入的方式,通过人机交互,将辩论场景所处的环节输入辩论机器人中,以控制辩论机器人判断当前所处的辩论场景的环节。
105.示例地,输入1,表示理论环节;输入2,表示交锋环节;输入3,表示小结环节;输入4,表示自由辩环节;输入5,表示总结环节。
106.在一些可能的实施例中,反驳性辩论语言可以通过以下方式确定:
107.将预设的辩论场景输入辩论机器人中;
108.采用语言文本生成模型识别辩论机器人当前的辩手角色;
109.确定辩论机器人当前所处的辩论场景的环节;
110.根据预设的辩论场景、辩论机器人当前所处的辩论场景的环节,控制语言文本模型生成有针对性的反驳性辩论文本内容,并根据辩论机器人当前的辩手角色输出反驳性辩论语言,实现辩论。
111.在一些可能的实施例中,所述方法还包括:
112.辩论机器人存储预设的辩论场景的语音信息。
113.示例地,辩论机器人可以以列表的方式存储对方辩手输出的语音信息,即将对方辩手的一辩、二辩、三辩、四辩的语音信息以列表的方式存储在辩论机器人的系统内。
114.辩论机器人还可以以列表的方式存储辩论机器人所在一方的辩手输出的语音信息,即将辩论机器人一方的一辩、二辩、三辩、四辩的语音信息以列表的方式存储在辩论机器人的系统内。
115.在一种可能的实施例中,辩论机器人将已存储的对方辩、辩论机器人一方的辩手的语音信息作为输入,控制辩论机器人的语言文本生成模型精准生成目标辩论语言文本,实现良好的辩论效果。
116.在一些可能的实施例中,可以以预设的输出速度,控制语言文本生成模型生成目标辩论语言文本,以达到预设的辩论场景对应的辩论时长的要求,并根据辩论场景的要求,确定生成文字的数量。
117.示例地,预设的输出速度可以为150字/分钟。
118.通过上述技术方案,实现辩论机器人和人类辩手的对抗性辩论,促进人类辩手的能力提升,并且,辩论机器人能够适应不同的辩论场景,突破时间限制陪伴人类辩手进行辩论训练,辩论机器人还可以用于辩论教学,对辩论领域具有深远意义。
119.基于同一构思,本公开还提供一种基于语音处理的辩论机器人的控制装置,图3是根据一示例性实施例示出的一种基于语音处理的辩论机器人的控制装置的框图。如图3所示,该基于语音处理的辩论机器人的控制装置100包括获取模块110、训练模块120、输入模块130、控制模块140。
120.获取模块110,用于获取辩论物料训练集;
121.训练模块120,用于将所述辩论物料训练集输入预设训练模型中,控制所述辩论机器人学习辩论物料,所述预设训练模型包括低秩适配器,所述低秩适配器用于对所述预设训练模型进行优化处理;
122.输入模块130,用于将预设的辩论场景、所述预设的辩论场景对应的辩论时长以及辩论机器人的分饰角色输入所述辩论机器人中;
123.控制模块140,用于根据所述预设的辩论场景和所述辩论场景的语音信息,控制所述辩论机器人在所述预设的辩论场景对应的辩论时长内输出目标辩论语言。
124.通过上述技术方案,通过将辩论物料训练集输入预设训练模型中,通过低秩适配器进行模型训练,预设训练机器人获取辩论物料知识,从而控制辩论机器人学习辩论物料,加强辩论机器人在辩论领域的垂直深度,并采用低秩适配器,减少训练参数量,提高预设训练模型的训练效率;将预设的辩论场景、预设的辩论场景对应的辩论时长以及辩论机器人的辩手角色输入辩论机器人中,并根据预设的辩论场景和辩论场景的语音信息,控制辩论机器人输出目标辩论语言,生成机器人辩手,并形成真实的辩论过程,为人类辩手提供陪练功能,以提高人类辩手的辩论能力和辩论技巧。
125.可选地,控制模块140包括:
126.获取子模块,用于通过与所述辩论机器人连接的麦克风接口,获取所述辩论场景的语音信息;
127.第一确定子模块,用于根据所述麦克风接口的编号,确定所述麦克风接口对应的发言辩手在所述辩论场景的语音信息;
128.第二确定子模块,用于将所述发言辩手在所述辩论场景的语音信息输入语音识别模型中,确定所述辩论场景的语音文本信息;
129.第三确定子模块,用于将所述预设的辩论场景和所述辩论场景的语音文本信息输入语言文本生成模型中,确定目标辩论语言文本;
130.输出子模块,用于将所述目标辩论语言文本输入语音播报模型中,确定目标辩论语言,控制所述辩论机器人输出所述目标辩论语言。
131.可选地,输出子模块包括:
132.第四确定子模块,用于根据所述辩论机器人的辩手角色,确定具有所述辩手角色对应语调的目标辩论语言,控制所述机器人以所述辩手角色对应语调输出所述目标辩论语言。
133.可选地,所述装置100还包括:
134.第一确定模块,用于根据辩论题目要求文本,确定辩论立场,所述辩论立场包括正面立场和反面立场;
135.理解模块,用于将所述辩论题目要求文本和所述辩论立场输入语言文本生成模型中,控制所述辩论机器人理解所述辩论场景的语音信息。
136.可选地,第三确定子模块包括:
137.第五确定子模块,用于若所述辩论机器人处于预设的辩论场景的立论环节,将所述立论环节输入所述语言文本生成模型中,确定第一目标辩论语言文本;
138.第六确定子模块,用于若所述辩论机器人处于预设的辩论场景的交锋环节,将所述交锋环节和所述辩论场景的语音文本信息输入语言文本生成模型中,确定第二目标辩论语言文本;
139.第七确定子模块,用于若所述辩论机器人处于预设的辩论场景的自由辩论环节,将所述自由辩论环节和所述自由辩论环节中的初始发言辩手的语音文本信息输入语言文本生成模型中,确定第三目标辩论语言文本。
140.可选地,所述装置100还包括:
141.识别模块,用于通过计时的方式和/或触发预设关键字的方式和/或用户输入的方式,控制所述辩论机器人识别所处的预设的辩论场景的环节。
142.可选地,所述装置100还包括:
143.存储模块,用于所述辩论机器人存储所述预设的辩论场景的语音信息。
144.关于上述实施例中的系统,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
145.在另一示例性实施例中,还提供了一种包括程序指令的非临时性计算机可读存储介质,该程序指令被处理器执行时实现上述的第一方面的基于连通性分析的气管分割方法的步骤。例如,该计算机可读存储介质可以为上述包括程序指令的存储器,上述程序指令可由电子设备的处理器执行以完成上述基于连通性分析的气管分割方法。
146.在另一示例性实施例中,还提供一种计算机程序产品,该计算机程序产品包含能够由可编程的装置执行的计算机程序,该计算机程序具有当由该可编程的装置执行时用于执行上述的基于连通性分析的气管分割方法的代码部分。
147.图4是根据一示例性实施例示出的一种基于语音处理的辩论机器人系统的框图。如图4所示,在一些可能的实施例中,还提供一种基于语音处理的辩论机器人系统,包括:
148.语音识别模块,所述语音识别模块与麦克风连接,所述语音识别模块用于识别每一发言辩手的语音信息,将所述每一发言辩手的语音信息转化为语音文本信息;
149.语言文本生成模块,所述语言文本生成模块与语音识别模块连接,所述语言文本生成模块用于理解辩论场景的信息并生成目标辩论语言文本;
150.语音播报模块,所述语音播报模块与所述语言文本生成模块连接,所述语音播报模块用于将目标辩论语言文本转化为目标辩论语言。
151.以上对本发明的具体实施例进行了描述。需要理解的是,本发明并不局限于上述特定实施方式,本领域技术人员可以在权利要求的范围内做出各种变形或修改,这并不影响本发明的实质内容。上述各优选特征在互不冲突的情况下,可以任意组合使用。
技术特征:
1.一种基于语音处理的辩论机器人的控制方法,其特征在于,包括:获取辩论物料训练集;将所述辩论物料训练集输入预设训练模型中,控制所述辩论机器人学习辩论物料,所述预设训练模型包括低秩适配器,所述低秩适配器用于对所述预设训练模型进行优化处理;将预设的辩论场景、所述预设的辩论场景对应的辩论时长以及辩论机器人的辩手角色输入所述辩论机器人中;根据所述预设的辩论场景和所述辩论场景的语音信息,控制所述辩论机器人在所述预设的辩论场景对应的辩论时长内输出目标辩论语言。2.根据权利要求1所述的方法,其特征在于,所述根据所述预设的辩论场景和所述辩论场景的语音信息,控制所述辩论机器人在所述预设的辩论场景对应的辩论时长内输出目标辩论语言,包括:通过与所述辩论机器人连接的麦克风接口,获取所述辩论场景的语音信息;根据所述麦克风接口的编号,确定所述麦克风接口对应的发言辩手在所述辩论场景的语音信息;将所述发言辩手在所述辩论场景的语音信息输入语音识别模型中,确定所述辩论场景的语音文本信息;将所述预设的辩论场景和所述辩论场景的语音文本信息输入语言文本生成模型中,确定目标辩论语言文本;将所述目标辩论语言文本输入语音播报模型中,确定目标辩论语言,控制所述辩论机器人输出所述目标辩论语言。3.根据权利要求2所述的方法,其特征在于,所述将所述目标辩论语言文本输入语音播报模型中,确定目标辩论语言,控制所述辩论机器人输出所述目标辩论语言,包括:根据所述辩论机器人的辩手角色,确定具有所述辩手角色对应语调的目标辩论语言,控制所述机器人以所述辩手角色对应语调输出所述目标辩论语言。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:根据辩论题目要求文本,确定辩论立场,所述辩论立场包括正面立场和反面立场;将所述辩论题目要求文本和所述辩论立场输入语言文本生成模型中,控制所述辩论机器人理解所述辩论场景的语音信息。5.根据权利要求2所述的方法,其特征在于,所述将所述预设的辩论场景和所述辩论场景的语音文本信息输入语言文本生成模型中,确定目标辩论语言文本,包括:若所述辩论机器人处于预设的辩论场景的立论环节,将所述立论环节输入所述语言文本生成模型中,确定第一目标辩论语言文本;若所述辩论机器人处于预设的辩论场景的交锋环节,将所述交锋环节和所述辩论场景的语音文本信息输入语言文本生成模型中,确定第二目标辩论语言文本;若所述辩论机器人处于预设的辩论场景的自由辩论环节,将所述自由辩论环节和所述自由辩论环节中的初始发言辩手的语音文本信息输入语言文本生成模型中,确定第三目标辩论语言文本。6.根据权利要求1所述的方法,其特征在于,所述方法还包括:
通过计时的方式和/或触发预设关键字的方式和/或用户输入的方式,控制所述辩论机器人识别所处的预设的辩论场景的环节。7.根据权利要求1所述的方法,其特征在于,所述方法还包括:所述辩论机器人存储所述预设的辩论场景的语音信息。8.一种基于语音处理的辩论机器人的控制装置,其特征在于,包括:获取模块,用于获取辩论物料训练集;训练模块,用于将所述辩论物料训练集输入预设训练模型中,控制所述辩论机器人学习辩论物料,所述预设训练模型包括低秩适配器,所述低秩适配器用于对所述预设训练模型进行优化处理;输入模块,用于将预设的辩论场景、所述预设的辩论场景对应的辩论时长以及辩论机器人的分饰角色输入所述辩论机器人中;控制模块,用于根据所述预设的辩论场景和所述辩论场景的语音信息,控制所述辩论机器人在所述预设的辩论场景对应的辩论时长内输出目标辩论语言。9.一种非临时性计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现权利要求1-7中任一项所述方法的步骤。10.一种基于语音处理的辩论机器人系统,其特征在于,包括:语音识别模块,所述语音识别模块与麦克风连接,所述语音识别模块用于识别每一发言辩手的语音信息,将所述每一发言辩手的语音信息转化为语音文本信息;语言文本生成模块,所述语言文本生成模块与语音识别模块连接,所述语言文本生成模块用于理解辩论场景的信息并生成目标辩论语言文本;语音播报模块,所述语音播报模块与所述语言文本生成模块连接,所述语音播报模块用于将目标辩论语言文本转化为目标辩论语言。
技术总结
本公开提供一种基于语音处理的辩论机器人的控制方法、装置、介质及基于语音处理的辩论机器人系统。基于语音处理的辩论机器人的控制方法包括:获取辩论物料训练集;将辩论物料训练集输入预设训练模型中,控制辩论机器人学习辩论物料,预设训练模型包括低秩适配器,低秩适配器用于对预设训练模型进行优化处理;将预设的辩论场景、预设的辩论场景对应的辩论时长以及辩论机器人的辩手角色输入辩论机器人中;根据预设的辩论场景和辩论场景的语音信息,控制辩论机器人在预设的辩论场景对应的辩论时长内输出目标辩论语言。通过本公开,能够生成机器人辩手,适应各种辩论场景并突破时间限制陪伴人类进行辩论训练或者辩论比赛。限制陪伴人类进行辩论训练或者辩论比赛。限制陪伴人类进行辩论训练或者辩论比赛。
技术研发人员:凌旭峰 梁景新 袁昊 李汪韬 周丽婕
受保护的技术使用者:上海师范大学天华学院
技术研发日:2023.06.30
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:脑胶质瘤分割和三维可视化模型训练方法及系统 下一篇:一种耐腐蚀塑钢门窗的制作方法