一种对话生成方法及其在情感陪护中的应用
未命名
09-29
阅读:47
评论:0
1.本发明涉及对话内容识别及信息应答技术领域,尤其涉及一种对话生成方法及其在情感陪护中的应用。
背景技术:
2.传统的对话生成方法通常基于预定义的规则或模板,这种方法受限于固定的规则和模板,无法灵活地生成自然流畅的对话。近年来,随着深度学习技术的快速发展,语言模型如gpt等已经取得了显著的突破。语言模型可以通过大规模的训练数据学习到语言的统计规律和上下文信息,从而能够生成更加自然、连贯的对话文本。此外,对于一些特殊的场景中,还鲜有相关文献揭示语言模型的应用,例如情感陪护场景中。
3.为此,本发明提供了一种对话生成方法,以实现更加自然流畅的对话,并将其应用在情感陪护场景中。
技术实现要素:
4.为解决上述问题,本发明提供了一种对话生成方法及其在情感陪护中的应用。
5.为了实现上述的技术目的,本发明所采用的技术方案为:
6.一种对话生成方法,包括:
7.步骤1):获取历史对话内容;
8.步骤2):将输入的对话内容进行上下文理解,形成上下文理解的意图结果;
9.步骤3):将对话内容输入到训练好的语言模型中,结合上下文理解的意图结果,输出匹配率最高的最佳回复。
10.作为一种可能的实施方式,进一步,本案步骤2)中将输入的对话内容进行上下文理解,形成上下文理解结果;具体包括如下步骤:
11.步骤2.1):将输入的对话内容进行分词,将句子切分为单词或子词的序列;
12.步骤2.2):使用词性标注技术,为每个单词标注其词性;
13.步骤2.3):通过句法分析技术,识别句子中的短语结构和句法依赖关系;
14.步骤2.4):识别对话中的实体信息,并对识别出的实体进行分类和标注;
15.步骤2.5):将分词、词性标注和命名实体识别的结果进行结合,构建对话上下文信息;
16.步骤2.6):将对话上下文信息输入训练好的意图识别模型中进行对话意图的识别与分类,并输出上下文理解的意图结果。
17.作为一种较优的选择实施方式,优选的,步骤2.5)中将构建的对话上下文信息以向量形式表达。
18.作为一种可能的实施方式,进一步,意图识别模型的训练方法,具体包括如下步骤:
19.步骤a):收集带有标注的对话数据集,包括用户对话和对应的意图标签;
20.步骤b):对对话文本进行分词,将文本切分为单词或子词的序列,并基于分词结果构建词袋模型的文本表示形式;
21.步骤c):使用独热编码或整数编码,将意图标签进行编码;
22.步骤d):将步骤b)中的文本数据作为特征输入,标签作为输出,对模型进行训练直至模型收敛。
23.作为一种可能的实施方式,进一步,步骤d)中模型选用朴素贝叶斯、支持向量机(svm)、循环神经网络(rnn)、卷积神经网络(cnn)中任意一种。
24.作为一种可能的实施方式,进一步,本案步骤3)中将对话内容输入到训练好的语言模型中,结合上下文理解的意图结果,输出匹配率最高的最佳回复;具体包括如下步骤:
25.步骤3.1):将对话内容进行序列化处理,生成序列化的对话数据;
26.步骤3.2):将对话数据输入到训练好的语言模型中,训练好的语言模型输出多种回复;
27.步骤3.3)将多种回复输入到训练好的意图识别模型中,将与上下文理解的意图结果匹配率最高的回复作为输出。
28.作为一种可能的实施方式,进一步,步骤3)中语言模型的训练方法,包括如下步骤:
29.步骤a):收集大规模的对话数据集;
30.步骤b):将步骤a)得到的对话数据转换为token序列,将每个词或字符映射为一个唯一的标识符,基于训练数据构建词汇表,将所有出现的标识符收集起来,并为每个标识符分配一个唯一的索引;
31.步骤c):将步骤a)得到的对话数据转换为语言模型可接受的数值表示形式,使用词汇表中的索引替换原始对话数据中的词或字符,将其转换为对应的标识符序列,得到序列化的对话数据;
32.步骤d):将序列化后的对话数据输入到语言模型中进行训练,通过反向传播算法更新模型的参数,不断迭代优化模型的性能,直至模型收敛。
33.本发明还提供了一种应用于情感陪护的对话生成方法,包括:
34.根据对话内容识别用户的情绪状态;
35.应用上述对话生成方法生成对话回复;
36.根据用户的情绪状态,在对话回复中添加对应表情包或语气词。
37.基于上述,本发明还提供一种计算机可读的存储介质,所述的存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述的至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行实现如上述对话生成方法或上述应用于情感陪护的对话生成方法。
38.采用上述的技术方案,本发明与现有技术相比,其具有的有益效果为:
39.本发明提供的对话方法能够根据用户上下文的对话意图识别用户意图,具有较好的上下文把握能力,能够适应各种对话场景,且生成的对话更加自然、连贯。
40.本发明提供的应用于情感陪护的对话生成方法能够结合用户的情绪状态添加对应的表情与语气词,使生成的对话内容更加生动,提升了用户的使用体验,适宜进一步推广应用。
附图说明
41.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
42.图1是对话生成方法的简要实施流程示意图;
43.图2是应用于情感陪护的对话生成方法的简要实施流程示意图。
具体实施方式
44.下面结合附图和实施例,对本发明作进一步的详细描述。特别指出的是,以下实施例仅用于说明本发明,但不对本发明的范围进行限定。同样的,以下实施例仅为本发明的部分实施例而非全部实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
45.参照附图1所示,本实施例方案一种对话生成方法,其包括:
46.步骤1):获取历史对话内容;
47.步骤2):将输入的对话内容进行上下文理解,形成上下文理解的意图结果;具体包括如下步骤:
48.步骤2.1):将输入的对话内容进行分词,将句子切分为单词或子词的序列;
49.步骤2.2):使用词性标注技术,为每个单词标注其词性(如名词、动词等);
50.步骤2.3):通过句法分析技术,识别句子中的短语结构和句法依赖关系(如主谓关系、修饰关系等);
51.步骤2.4):识别对话中的实体信息(如人名、地名、组织机构名等),并对识别出的实体进行分类和标注(如人名标记为"person"、地名标记为"location"等);
52.步骤2.5):将分词、词性标注和命名实体识别的结果进行结合,构建对话上下文信息;其中,构建的对话上下文信息以向量形式表达,以便模型理解对话的语境。
53.步骤2.6):将对话上下文信息输入训练好的意图识别模型中进行对话意图的识别与分类,并输出上下文理解的意图结果。利用对话历史的信息,更好地理解当前对话的上下文,包括上一轮的问句、回答等。
54.上述意图识别模型的训练方法,具体包括如下步骤:
55.步骤a):收集带有标注的对话数据集(其中,数据集应涵盖多种对话场景和各种可能的意图),包括用户对话和对应的意图标签;
56.步骤b):对对话文本进行分词,将文本切分为单词或子词的序列,并基于分词结果构建词袋模型的文本表示形式;
57.步骤c):使用独热编码或整数编码,将意图标签进行编码,以便模型训练和预测;
58.步骤d):将步骤b)中的文本数据作为特征输入,标签作为输出,对模型(其中,模型可选用朴素贝叶斯、支持向量机(svm)、循环神经网络(rnn)、卷积神经网络(cnn)中任意一种。)进行训练直至模型收敛。进一步的,在模型训练过程中通过反向传播算法更新模型的参数,不断迭代优化模型的性能。
59.步骤3):将对话内容输入到训练好的语言模型中,结合上下文理解的意图结果,输
出匹配率最高的最佳回复;具体包括如下步骤:
60.步骤3.1):将对话内容进行序列化处理,生成序列化的对话数据;
61.步骤3.2):将对话数据输入到训练好的语言模型中,训练好的语言模型输出多种回复;其中,语言模型的训练方法,包括如下步骤:
62.步骤a):收集大规模的对话数据集,包括用户对话记录、聊天机器人对话数据等;
63.步骤b):将步骤a)得到的对话数据转换为token序列,将每个词或字符映射为一个唯一的标识符,基于训练数据构建词汇表,将所有出现的标识符收集起来,并为每个标识符分配一个唯一的索引;
64.步骤c):将步骤a)得到的对话数据转换为语言模型(其中,语言模型选用循环神经网络(rnn))可接受的数值表示形式,使用词汇表中的索引替换原始对话数据中的词或字符,将其转换为对应的标识符序列,得到序列化的对话数据;
65.步骤d):将序列化后的对话数据输入到语言模型中进行训练,通过反向传播算法更新模型的参数,不断迭代优化模型的性能,直至模型收敛。
66.步骤3.3)将多种回复输入到训练好的意图识别模型中,将与上下文理解的意图结果匹配率最高的回复作为输出。
67.参照附图2所示,本实施例方案一种应用于情感陪护的对话生成方法,其包括:
68.根据对话内容识别用户的情绪状态;
69.应用如权利要求1至8之一所述的对话生成方法生成对话回复;
70.根据用户的情绪状态,在对话回复中添加对应表情包(拥抱、亲吻、加油等表情)或语气词(例如:哦、呀、啊...等)。(例如当根据对话内容识别出用户心情沮丧时,对话回复的末尾自动添加“拥抱”表情。)
71.另外,在本发明各个实施方式中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
72.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)或处理器(processor)执行本发明各个实施方式方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
73.以上所述仅为本发明的部分实施例,并非因此限制本发明的保护范围,凡是利用本发明说明书及附图内容所作的等效装置或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
技术特征:
1.一种对话生成方法,其特征在于,包括:步骤1):获取历史对话内容;步骤2):将输入的对话内容进行上下文理解,形成上下文理解的意图结果;步骤3):将对话内容输入到训练好的语言模型中,结合上下文理解的意图结果,输出匹配率最高的最佳回复。2.如权利要求1所述的对话生成方法,其特征在于,步骤2)中将输入的对话内容进行上下文理解,形成上下文理解结果;具体包括如下步骤:步骤2.1):将输入的对话内容进行分词,将句子切分为单词或子词的序列;步骤2.2):使用词性标注技术,为每个单词标注其词性;步骤2.3):通过句法分析技术,识别句子中的短语结构和句法依赖关系;步骤2.4):识别对话中的实体信息,并对识别出的实体进行分类和标注;步骤2.5):将分词、词性标注和命名实体识别的结果进行结合,构建对话上下文信息;步骤2.6):将对话上下文信息输入训练好的意图识别模型中进行对话意图的识别与分类,并输出上下文理解的意图结果。3.如权利要求1所述的对话生成方法,其特征在于,步骤2.5)中将构建的对话上下文信息以向量形式表达。4.如权利要求2所述的对话生成方法,其特征在于,意图识别模型的训练方法,具体包括如下步骤:步骤a):收集带有标注的对话数据集,包括用户对话和对应的意图标签;步骤b):对对话文本进行分词,将文本切分为单词或子词的序列,并基于分词结果构建词袋模型的文本表示形式;步骤c):使用独热编码或整数编码,将意图标签进行编码;步骤d):将步骤b)中的文本数据作为特征输入,标签作为输出,对模型进行训练直至模型收敛。5.如权利要求4所述的对话生成方法,其特征在于,步骤d)中模型训练过程中通过反向传播算法更新模型的参数。6.如权利要求4所述的对话生成方法,其特征在于,步骤d)中模型选用朴素贝叶斯、支持向量机(svm)、循环神经网络(rnn)、卷积神经网络(cnn)中任意一种。7.如权利要求2所述的对话生成方法,其特征在于,步骤3)中将对话内容输入到训练好的语言模型中,结合上下文理解的意图结果,输出匹配率最高的最佳回复;具体包括如下步骤:步骤3.1):将对话内容进行序列化处理,生成序列化的对话数据;步骤3.2):将对话数据输入到训练好的语言模型中,训练好的语言模型输出多种回复;步骤3.3)将多种回复输入到训练好的意图识别模型中,将与上下文理解的意图结果匹配率最高的回复作为输出。8.如权利要求7所述的对话生成方法,其特征在于,步骤3)中语言模型的训练方法,包括如下步骤:步骤a):收集大规模的对话数据集;步骤b):将步骤a)得到的对话数据转换为token序列,将每个词或字符映射为一个唯一
的标识符,基于训练数据构建词汇表,将所有出现的标识符收集起来,并为每个标识符分配一个唯一的索引;步骤c):将步骤a)得到的对话数据转换为语言模型可接受的数值表示形式,使用词汇表中的索引替换原始对话数据中的词或字符,将其转换为对应的标识符序列,得到序列化的对话数据;步骤d):将序列化后的对话数据输入到语言模型中进行训练,通过反向传播算法更新模型的参数,不断迭代优化模型的性能,直至模型收敛。9.一种应用于情感陪护的对话生成方法,其特征在于,包括:根据对话内容识别用户的情绪状态;应用如权利要求1至8之一所述的对话生成方法生成对话回复;根据用户的情绪状态,在对话回复中添加对应表情包或语气词。10.一种计算机可读的存储介质,其特征在于:所述的存储介质中存储有至少一条指令、至少一段程序、代码集或指令集,所述的至少一条指令、至少一段程序、代码集或指令集由处理器加载并执行实现如权利要求1至8之一所述的对话生成方法或权利要求9所述的应用于情感陪护的对话生成方法。
技术总结
本发明公开了一种对话生成方法及其在情感陪护中的应用,其中,对话方法包括:步骤1):获取历史对话内容;步骤2):将输入的对话内容进行上下文理解,形成上下文理解的意图结果;步骤3):将对话内容输入到训练好的语言模型中,结合上下文理解的意图结果,输出匹配率最高的最佳回复。本发明提供的对话方法能够根据用户上下文的对话意图识别用户意图,具有较好的上下文把握能力,能够适应各种对话场景,且生成的对话更加自然、连贯。此外,本发明还提供了应用于情感陪护的对话生成方法,其能够结合用户的情绪状态添加对应的表情与语气词,使生成的对话内容更加生动,提升了用户的使用体验,适宜进一步推广应用。适宜进一步推广应用。适宜进一步推广应用。
技术研发人员:陈慧琴 何飞
受保护的技术使用者:南京交通职业技术学院
技术研发日:2023.07.31
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/