认知障碍检测方法、装置、设备和存储介质与流程
未命名
08-03
阅读:67
评论:0

1.本技术涉及自然语言处理领域,特别涉及一种认知障碍检测方法、装置、设备和存储介质。
背景技术:
2.认知状态是用于表示用户是否对人、事、物等有正确的理解、认识和判断,如果没有正确的认知状态,则存在认知障碍。认知障碍可以表现为记忆丧失、语言表达困难和情感表达减少等现象,现有技术中对认知障碍检测的方法通常是基于用户当下表现出来的一些语言、行为特征结合历史行为特征,进行词汇和句法分析后预测用户存在认知障碍的概率,检测方法较为被动,限制了预测结果的准确性。
技术实现要素:
3.本技术提供一种认知障碍检测方法、装置、设备和存储介质,提高认知障碍检测结果的准确性。
4.第一方面,本技术提供了一种认知障碍检测方法,该认知障碍检测方法包括:从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,其中,每轮对话交互的对话信息中还包括系统对话信息,系统对话信息用于引导用户提供包含有关联特征信息的用户对话信息,关联特征信息为与认知障碍的特征有关的信息;利用认知障碍检测模型对用户对话信息进行认知障碍检测,认知障碍检测模型用于确定包含有关联特征信息的用户对话信息与认知障碍概率值的对应关系;根据认知障碍检测模型输出的认知障碍概率值和预设概率阈值,确定用户是否存在认知障碍,并生成对应的认知障碍检测结果。
5.第二方面,本技术提供了一种认知障碍检测装置,该认知障碍检测装置包括:获取模块,用于从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,其中,每轮对话交互的对话信息中还包括系统对话信息,所述系统对话信息用于引导所述用户提供包含有关联特征信息的用户对话信息,所述关联特征信息为与认知障碍的特征有关的信息;检测模块,用于利用认知障碍检测模型对所述用户对话信息进行认知障碍检测,所述认知障碍检测模型用于确定包含有所述关联特征信息的用户对话信息与认知障碍概率值的对应关系;确定模块,用于根据所述认知障碍检测模型输出的认知障碍概率值和预设概率阈值,确定所述用户是否存在认知障碍,并生成对应的认知障碍检测结果。
6.第三方面,本技术提供了一种电子设备,该电子设备包括:至少一个处理器;以及与至少一个处理器通信连接的存储器;其中,存储器存储有可被至少一个处理器执行的一个或多个计算机程序,一个或多个计算机程序被至少一个处理器执行,以使至少一个处理器能够执行上述的认知障碍检测方法。
7.第四方面,本技术提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序在被处理器/处理核执行时实现上述的认知障碍检测方法。
8.本技术所提供的实施例,能够从至少一轮对话交互的对话信息中获取由用户输入
的用户对话信息,每轮对话交互的对话信息中还包括系统对话信息,该系统对话信息用于引导用于提供包含有关联特征信息的用户对话信息,即引导用户提供与认知障碍的特征有关的对话信息,然后利用认知障碍检测模型对所述用户对话信息进行认知障碍检测,得到认知障碍概率值,并根据认知障碍概率值和预设概率阈值确定用户是否存在认知障碍,并生成对应的认知障碍检测结果,根据该方法,由于用户对话信息中包含的关联特征信息与认知障碍的特征有关,因此基于该用户对话信息进行认知障碍检测,有利于提取隐含在用户对话信息中的认知障碍特征,从而有利于提高认知障碍检测的准确性。
9.应当理解,本部分所描述的内容并非旨在标识本技术的实施例的关键或重要特征,也不用于限制本技术的范围。本技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
10.附图用来提供对本技术的进一步理解,并且构成说明书的一部分,与本技术的实施例一起用于解释本技术,并不构成对本技术的限制。通过参考附图对详细示例实施例进行描述,以上和其他特征和优点对本领域技术人员将变得更加显而易见,在附图中:
11.图1为本技术实施例提供的一种认知障碍检测方法的流程图;
12.图2为本技术实施例提供的一种对话系统的结构示意图;
13.图3为本技术实施例提供的模块化功能的框图示意图;
14.图4示出本技术实施例提供的模型训练的整体逻辑示意图;
15.图5示出本技术实施例提供的认知障碍检测模型的训练过程示意图;
16.图6示出本技术实施例提供的认知障碍检测模型的服务流程示意图;
17.图7为本技术实施例提供的一种认知障碍检测装置的结构示意图;
18.图8为本技术实施例提供的一种电子设备的框图。
具体实施方式
19.为使本领域的技术人员更好地理解本技术的技术方案,以下结合附图对本技术的示范性实施例做出说明,其中包括本技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
20.在不冲突的情况下,本技术各实施例及实施例中的各特征可相互组合。
21.如本文所使用的,术语“和/或”包括一个或多个相关列举条目的任何和所有组合。
22.本文所使用的术语仅用于描述特定实施例,且不意欲限制本技术。如本文所使用的,单数形式“一个”和“该”也意欲包括复数形式,除非上下文另外清楚指出。还将理解的是,当本说明书中使用术语“包括”和/或“由
……
制成”时,指定存在特征、整体、步骤、操作、元件和/或组件,但不排除存在或添加一个或多个其它特征、整体、步骤、操作、元件、组件和/或其群组。“连接”或者“相连”等类似的词语并非限定于物理的或者机械的连接,而是可以包括电性的连接,不管是直接的还是间接的。
23.除非另外限定,否则本文所用的所有术语(包括技术和科学术语)的含义与本领域普通技术人员通常理解的含义相同。还将理解,诸如那些在常用字典中限定的那些术语应
当被解释为具有与其在相关技术以及本技术的背景下的含义一致的含义,且将不解释为具有理想化或过度形式上的含义,除非本文明确如此限定。
24.相关技术中,通常是获取用户提供的静态文本信息,对文本信息进行解析,文本中的词汇和语法进行统计分析,根据统计分析的结果输出预测的用户存在认知障碍的概率。但是这种方法仅能利用用户提供的静态文本进行词汇和语法分析,通过分析得到的与认知障碍的特征有关的信息有限,也很难获取用户的记忆力、语言表述力、情感表达力等有利于进行认知障碍检测的重要特征信息,限制了预测结果的准确性。
[0025][0026][0027][0028]
根据本技术实施例的认知障碍检测方法,能够在与用户的对话交互中,引导用户提供与认知障碍的特征有关的关联特征信息,利用该用户对话信息进行认知障碍检测,提高认知障碍检测结果的准确性。
[0029]
根据本技术实施例的认知障碍检测方法可以由终端设备或服务器等电子设备执行,终端设备可以为车载设备、用户设备(user equipment,ue)、移动设备、用户终端、终端、蜂窝电话、无绳电话、个人数字助理(personal digital assistant,pda)、手持设备、计算设备、车载设备、可穿戴设备等,方法可以通过处理器调用存储器中存储的计算机可读程序指令的方式来实现。服务器可以包括独立的物理服务器、有多个服务器组成的服务器集群或者能够进行云计算的云服务器。
[0030]
图1为本技术实施例提供的一种认知障碍检测方法的流程图。参照图1,该认知障碍检测方法可以包括以下步骤。
[0031]
s110,从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,其中,每轮对话交互的对话信息中还包括系统对话信息,系统对话信息用于引导用户提供包含有关联特征信息的用户对话信息,关联特征信息为与认知障碍的特征有关的信息。
[0032]
其中,用户对话信息为文本信息;在实际应用场景中,针对对话交互可以设置对话交互界面,对话交互界面上可以设置对话文本信息输入接口,通过对话文本信息输入接口来接收用户输入的文本形式的用户对话信息;对话交互界面上还可以设置有对话语音输入接口,通过语音输入接口接收用户输入的对话语音,对该对话语音进行语音识别,得到文本形式的用户对话信息。
[0033]
在一些实施例中,一轮对话交互是指一个对话轮次。示例性地,对话机器人和用户进行对话的一来一回合称一个对话轮次,来回多次称为多轮对话交互。
[0034]
在一些实施例中,关联特征信息为与认知障碍的特征有关的信息,与认知障碍的特征有关的信息,通常包括隐藏在用户对话信息中的记忆力、语言表述力、情感表达力等对检测认知障碍的重要特征,例如如下信息项中的至少一项:句子重复次数、词语重复次数、语义范畴(即语言所蕴含的意义和概念)错误次数、以及对预定事物的评价内容等信息;因此,本技术实施例的方法,可以通过系统对话信息来引导用户在输入的用户对话信息中提供包含有关联特征信息的用户对话信息,在每次会话交互中的对话信息中,系统对话信息的内容可以是日常闲聊中的各种话题,例如引导用户进行自我介绍,回忆和描述印象深刻的事件、对一段新闻进行评价、在给定时间内尽可能多地说出物体名称等等。
[0035]
应理解,关联特征信息还可以包括更多其他与认知障碍的特征有关的信息,只要是与记忆力、表述能力和情感反应能力有关的信息即可。
[0036]
s120,利用认知障碍检测模型对用户对话信息进行认知障碍检测,认知障碍检测模型用于确定包含有关联特征信息的用户对话信息与认知障碍概率值的对应关系。
[0037]
在该步骤中,认知障碍检测模型的输入为文本形式的用户对话信息(简称对话文本),输出为该用户存在认知障碍的概率值,认知障碍检测模型是预先训练得到的模型。
[0038]
s130,根据认知障碍检测模型输出的认知障碍概率值和预设概率阈值,确定用户是否存在认知障碍,并生成对应的认知障碍检测结果。
[0039]
在该步骤中,若认知障碍概率值大于预设概率阈值,则确定用户存在认知障碍;若认知障碍概率值大于或等于预设概率阈值,则确定用于不存在认知障碍。
[0040]
根据本技术的实施例,能够从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,每轮对话交互的对话信息中还包括系统对话信息,该系统对话信息用于引导用于提供包含有关联特征信息的用户对话信息,即引导用户提供与认知障碍的特征有关的对话信息,然后利用认知障碍检测模型对用户对话信息进行认知障碍检测,得到认知障碍概率值,并根据认知障碍概率值和预设概率阈值确定用户是否存在认知障碍,并生成对应的认知障碍检测结果,根据该方法,由于用户对话信息中包含的关联特征信息与认知障碍的特征有关,因此基于该用户对话信息进行认知障碍检测,有利于提取隐含在用户对话信息中的认知障碍特征,从而有利于提高认知障碍检测的准确性。
[0041]
下面结合图2中的对话系统,详细描述本技术实施例的认知障碍检测方法。图2示出本技术实施例的对话系统的结构示意图。如图2所示,对话系统200包括自然语言理解(natural language understanding,nlu)模块210、对话管理(dialog management,dm)模块220和自然语言生成(natural language generation,nlg)模块230。
[0042]
在一些实施例中,系统对话信息包括系统提问信息,用户对话信息包括用户应答信息;在步骤s110之前,该方法还包括如下步骤。
[0043]
s11,在与用户的当前一轮对话交互中,输出系统提问信息和接收用户输入的用户应答信息。
[0044]
在一些实施例中,在用户已登录图2所示的对话系统200的情况下,自然语言生成模块230可以根据后台数据库中预先存储的用户的历史特征行为信息,生成个性化欢迎语,并通过对话机器人输出该个性化欢迎语。其中,用户的历史特征行为信息,是在历史轮次的对话交互过程中,对该用户的特征行为信息进行统计而得到,统计得到的历史特征行为信息可以存储在预设的后台数据库中。示例性地,用户的历史特征行为信息包括但不限于:用户点击机器人推荐答案或问题列表的特征、用户在一定时间内重新进入对话系统的特征、用户对话时间间隔特征、用户提问次数特征等。
[0045]
在一些实施例中,对话机器人可以工业机器人,也可以是特种机器人;工业机器人是指面向工业领域的多关节机械手或多自由度机器人;特种机器人则是用于非制造业并服务于人类的各种先进机器人。
[0046]
在该实施例中,在输出个性化欢迎语后,即可启动与用户的对话交互,在当前一轮对话交互中,通过对话机器人输出系统提问信息来引导用户提供包含有关联特征信息的用户对话信息,然后获取由用户输入的用户对话信息,该用户对话信息用于对系统提问信息
进行回答,或者用于提出新的问题。
[0047]
s12,识别用户应答信息中包含的特征信息。
[0048]
在一些实施例中,参照图2,自然语言理解模块210用于识别用户应答信息中包含的特征信息,并具体包括以下步骤:对用户应答信息进行意图识别,得到用户意图信息;对用户应答信息进行实体识别,得到实体信息;对对话信息进行情感分类,得到情感类别信息;将用户意图信息、实体信息和情感类别信息,作为从用户应答信息中识别出的特征信息。
[0049]
在一些实施例中,可以通过意图识别模型对用户应答信息进行意图识别,意图识别模型用于确定输入的用户对话信息与用户意图的对应关系,该模型可以根据历史对话数据中的具有意图标注信息的对话训练文本进行模型训练得到;可以通过实体识别模型对用户应答信息进行实体识别,实体识别模型用于获取用户应答信息中包含的实体,该模型可以根据历史对话数据中的具有命名实体标注信息的对话训练文本进行模型训练得到;可以通过情感分类模型对对话信息进行情感分类,情感分类模型用于确定输入的用户对话信息与情感类别的对应关系,该模型可以根据历史对话数据中的具有情感分类标签的对话训练文本进行模型训练得到。
[0050]
在该实施例中,用户应答信息中包含的特征信息包括用户意图信息、实体信息和情感类别信息;用户意图可以理解为用户希望达到的目的或用户要做什么,用户意图信息包括多个候选用户意图和每个候选用户意图的概率值;实体信息可以包括从用户输入信息中识别出的命名实体;情感类别信息用于指示用户输入信息中所表达出的情感类别,情感类别例如可以包括积极、消极和中立三个类别。
[0051]
在该实施例中,可以从一轮对话交互的对话信息中获取由用户输入的用户对话信息,该对话信息经过意图识别、实体识别和情感分类,依次得到用户意图信息,实体信息和情感类别信息。
[0052]
s13,记录特征信息和历史对话信息,作为当前对话状态信息,其中,历史对话信息中包含与用户的每轮对话交互的对话信息。
[0053]
在该步骤中,与用户的每轮对话交互的对话信息中不仅包含系统对话信息,还包含用户对话信息。
[0054]
在本技术实施例中,对话状态表示:基于对话信息获取到的信息的存储状态;对话状态信息是从对话开始到当前对话的所有重要信息的总结,对话状态信息中至少包括:从当前一轮对话交互的用户应答信息中识别出的特征信息和历史对话信息。
[0055]
在一些实施例中,参照图2,对话管理模块220用于记录特征信息和历史对话信息,作为当前对话状态信息。
[0056]
具体地,对话管理模块220可以根据用户意图信息所包括的多个候选用户意图和每个候选用户意图的概率值进行意图决策,意图决策用于根据每个候选用户意图的概率值,从多个候选用户意图中,选择一个候选用户意图作为用户意图,例如:将概率值最大的候选用户意图作为决策出的用户意图;对话管理模块220还可以根据决策出的用户意图确定需要填充的槽位信息(简称槽位),并根据识别出的实体信息进行槽位填充,其中,槽位信息可以理解为:用户意图的实现所需获取的关键信息,槽位填充是指收集或填充用户意图的实现所需获取的关键信息。例如决策出的用户意图为了解当天天气,而了解天气需要知
道地点、时间这些必要的信息,这些必要信息就是需要填充的关键信息。
[0057]
在一些实施例中,当前对话状态信息还可以包括与用户意图对应的槽位信息。在一些场景中,可以根据填充的槽位信息进行状态更新,状态更新是指更新对话状态信息,并将更新后的对话状态信息作为当前对话状态信息。当前对话状态信息中包括如下信息项:用户应答信息中包含的特征信息(用户意图、实体信息、情感类别信息)、槽位信息和历史对话信息;对话管理模块220可以根据更新后的对话状态信息进行对话状态跟踪(dialogue state tracking,dst),即对更新后的对话状态信息进行记录,从而保持人机对话交互中对话记录的完整性。
[0058]
s14,通过主动学习的方式,基于当前对话状态信息和预先统计的用户的历史特征行为信息,从预设的关联特征信息中筛选第一关联特征信息;其中,主动学习用于根据对话状态信息和历史特征行为信息确定预设的关联特征信息中的各个关联特征信息的重要程度,第一关联特征信息为重要程度大于预设阈值的关联特征信息。
[0059]
在该实施例中,可以通过主动学习(active learning)的方式,基于当前对话状态信息和预先统计的历史特征行为信息,从关联特征信息中筛选出重要程度大于预设阈值的第一关联特征信息。
[0060]
在一些实施例中,关联特征信息的重要程度与第一关联特征信息的置信度成正比;参照图2,步骤s14具体可以包括:将当前对话状态信息和用户的历史特征行为信息,输入主动学习模型计算预设需要获取的每个关联特征信息的置信度,从预设需要获取的每个关联特征信息中,按照所述置信度从高到低的顺序筛选出至少一个关联特征信息作为第一关联特征信息;其中,主动学习模型用于确定第一关联特征信息的置信度与对话状态信息和特征行为信息的对应关系。
[0061]
在一些实施例中,主动学习模型,可以根据历史对话数据中具有关联特征标签和特征行为标签的对话训练文本进行模型训练得到。
[0062]
在该实施例中,对话管理模块220可以将当前对话状态信息和预先统计的用户的历史特征行为信息,输入主动学习模型进行处理,将主动学习模型输出的当前置信度按照从高到低进行排序,将排序靠前的至少一个关联特征信息,作为第一关联特征信息,也就当前最具影响的检测认知障碍的关联特征信息。
[0063]
s15,根据第一关联特征信息生成用于下一轮对话交互的系统提问信息。
[0064]
在该步骤中,下一轮对话交互的系统提问信息用于引导用户提供与第一关联特征信息有关的用户对话信息。
[0065]
在一些实施例中,步骤s15具体可以包括:将第一关联特征信息作为参考信息;将参考信息输入决策模型生成提问信息,其中,决策模型用于确定问答知识库中存储的预定参考信息与提问信息的对应关系;将生成的提问信息作为下一轮对话交互的系统提问信息。
[0066]
在一些实施例中,在步骤s15中,还可以将第一关联特征信息、当前一轮对话交互中的用户对话信息和历史对话信息作为参考信息,将该参考信息输入决策模型生成提问信息,使得生成的提问信息可以参考到更多信息,从而输出更佳的系统提问信息。
[0067]
继续参照图2,“动作生成”即生成系统提问信息对应的系统对话动作。具体地,对话管理模块220可以将第一关联特征信息输入决策模型生成提问信息,得到决策模型输出
的系统提问信息,然后生成与输出的系统提问信息对应的系统对话动作。其中,动作是指系统对话动作,系统对话动作用于指示系统提问信息的用途,系统对话动作的类型包括反问(用于对用户对话信息进行反问)、确认(用于引导用户对用户意图给出肯定或否定的确认)、澄清(用于引导用户表达明确的意图)、信息收集(用于通过信息问询来收集用户信息)、欢迎(用于输出欢迎语)、结束(用于输出结束语);应理解,系统对话动作还可以是其它类型的动作,系统对话动作有利于用户理解系统提问信息,并有利于提升用户体验。
[0068]
在一些实施例中,如自然语言生成模块230中的“生成文本”所示,自然语言生成模块230可以利用自然语言生成模型,将系统提问信息对应的系统对话动作编码为用户可理解的文本信息;在实际应用时,可以灵活选择系统对话动作转换为自然语言的方式,如自然语言生成模块230中的“话术模板”所示,自然语言生成模块230可以获取预设的话术模板,在系统对话信息中添加与话术模板对应的信息;其中,话术模板中例如规定了:需要在系统对话信息中添加的礼貌用语、开场白和固定话术内容等。
[0069]
在一些实施例中,还可以将自然语言文本转换为相应的语音数据,并通过语音合成技术(text to speech,tts)将输出的自然语言文本转化为对应的语音,通过播放设备进行语音播报,以通过该语音用于进行与用户的下一轮对话交互。
[0070]
示例性地,自然语言生成模型用于确定系统对话动作与生成的文本信息之间的对应关系,自然语言生成模型可以是序列到序列(sequence to sequence,seq2seq)文本生成模型;具体地,seq2seq文本生成模型中的编码器会将输入文本的内容统一映射成固定的中间序列信息,再利用解码器对其进行解码,从而生成输出文本。
[0071]
在上述结合图2描述的认知障碍检测方法中,在每轮对话交互中,可以通过系统对话信息引导用户提供与认知障碍的特征有关的对话信息,而基于该用户对话信息进行认知障碍检测,有利于提取隐含在用户对话信息中的认知障碍特征,并有利于提高认知障碍检测的准确性。
[0072]
在一些实施例中,在步骤s120中的利用认知障碍检测模型对用户对话信息进行认知障碍检测之后,该认知障碍检测方法还包括:s21,将利用认知障碍检测模型对用户对话信息进行认知障碍检测得到的检测结果作为第一检测结果,第一检测结果用于表示用户是否存在认知障碍;s22,按照预设的认知障碍检测规则,对用户对话信息进行认知障碍检测,得到第二检测结果,第二检测结果用于表示用户是否存在认知障碍;s23,将第一检测结果和第二检测结果进行融合,将融合得到的检测结果作为认知障碍检测结果,认知障碍检测结果用于表示用户对话信息与认知障碍概率值的对应关系。
[0073]
示例性地,认知障碍检测规则中包括的规则项例如可以包括:从输出系统对话信息到接收到用户对话信息之间的时长超过预设的第一时长阈值、用户对话信息对应的对话时长超过预设的第二时长阈值、系统对话信息和用户对话信息都是问题的对话交互次数超过预设的第一次数阈值、接收的用户对话信息答非所问的次数超过预设的第二次数阈值等;其中,答非所问例如包括:系统对话信息和用户对话信息涉及不同场景(例如系统对话信息为“想听音乐吗”,用户对话信息“今天天气真好”)、用户对话信息为无意义内容(例如系统对话信息为“一下申请这么多贷款,打算做什么呢”,用户对话信息为“是的,我申请了很多贷款”)等。
[0074]
在该实施例中,认知障碍检测规则中包括的规则项的数量至少为1;将至少一轮对
话交互的对话信息中获取的由用户输入的用户对话信息,与认知障碍检测规则中的规则项进行匹配,当匹配到的规则项的数量大于或等于预设的规则项数量阈值时,确定第二检测结果为该用户存在认知障碍。其中,规则项数量阈值大于或等于1且小于或等于规则项总数量。
[0075]
应理解,第一时长阈值、第二时长阈值、第一次数阈值、第二次数阈值和规则项数量阈值可以根据实际应用场景进行设置,认知障碍检测规则还可以包括其他规则项,具体可以根据实际需要进行设置。
[0076]
在一些实施例中,可以通过规则引擎(rule engine)获取认知障碍检测规则,以及通过规则引擎来确定用户对话信息是否存在认知障碍。
[0077]
在该实施例中,可以将认知障碍检测模型的检测结果和基于认知障碍检测规则的检测结果进行加权融合,将融合后的检测结果作为认知障碍检测结果,可以提高认知障碍检测所参考信息的全面性,进一步提高检测结果的准确性。
[0078]
下面结合图3,描述本技术实施例的检测系统的模块化的功能框图。图3示出本技术实施例的模块化功能的框图示意图。图3与图2中相同或等同的模块使用相同的标号。如图3所示,本技术实施例的检测系统包括离线训练和在线检测两个阶段。
[0079]
通过图3可以看出,对于离线训练阶段,对于对话系统中需要使用的模型,可以利用历史对话数据进行相应的人工标注,得到标注后的历史对话数据,并根据标注后的历史对话数据进行模型训练得到训练后的模型,并利用训练后的模型对对话系统中使用的模型进行模型更新;示例性地,对话系统中使用的模型包括上述实施例中描述的意图识别模型、实体识别模型、情感分类模型、认知障碍检测模型、主动学习模型和自然语言生成模型。对于在线预测阶段,图3中的自然语言理解模块210、对话管理模块220以及自然语言生成模块230的功能与图2中的相同模块具有相同的功能,在此不再赘述。
[0080]
下面结合图4-图6,描述本技术实施例的认知障碍检测模型的训练过程和服务流程。图4示出本技术实施例提供的模型训练的整体逻辑示意图;图5示出本技术实施例提供的认知障碍检测模型的训练过程示意图;图6示出本技术实施例提供的认知障碍检测模型的服务流程示意图。
[0081]
如图4所示,该模型训练系统包括:对话数据集构建模块410、模型训练模块420、分析模块430、重新标注模块440、规则更新模块450。
[0082]
在一些实施例中,对话数据集构建模块410用于构建用于进行认知障碍检测模型训练所需使用的对话文本样本集合。示例性地,可以从历史数据库中抽取用户对话数据,并对抽取的用户对话数据进行数据清洗,以用于过滤重复数据和不规范数据,对于清洗后的用户对话数据,根据对话标识(id)和时间信息形成人机对话问答信息对,对话标识用于指示对话者的身份信息;将形成的人机对话问答信息对转换为标注工具支持的数据格式,组织专业标注人员对人机对话问答信息对中的用户对话数据进行人工标注,形成对话文本样本集合。
[0083]
在一些实施例中,模型训练模块420,用于根据对话文本样本集合进行认知障碍检测模型的训练;分析模块430用于对训练后的认知障碍检测模型进行性能验证,得到至少一个性能指标值;重新标注模块440用于在性能指标值未达到预设的性能指标合格条件的情况下,对训练集所包含对话文本样本的标注标签进行重新标注,得到新的训练集;规则更新
模块450用于在性能指标值未达到预设的性能指标合格条件的情况下,对上述实施例描述的认知障碍检测规则进行调整,以对认知障碍检测规则进行更新。
[0084]
示例性地,对认知障碍检测规则的调整可以包括:对规则项内容的调整和对规则项数量的调整中的至少一种;其中,对规则项内容的调整包括:对上述实施例描述的规则项中的第一时长阈值、第二时长阈值、第一次数阈值和第二次数阈值的具体取值的调整;对规则项数量的调整包括:减少规则项的数量或增加新的规则项。
[0085]
下面通过具体实施例进行说明认知障碍检测模型的迭代训练过程。
[0086]
在一些实施例中,在利用认知障碍检测模型对用户对话信息进行认知障碍检测之前,方法还包括:
[0087]
s31,将预先获取的对话文本样本集合划分为m份互不相交的子集,其中,至多m-2个子集为训练集,至少1个子集为验证集,至少1个子集为测试集,每个子集中包括至少1个对话文本样本,m为大于或等于3的整数;
[0088]
其中,训练集、验证集和测试集中的对话文本样本均包含标注标签,标注标签包括:认知状态标签、语义概念标签和影响要素标签;认知状态标签用于指示是否存在认知障碍,语义概念标签用于指示对话文本样本中的词语的语义分类,影响要素标签用于表示对话文本样本中的关联特征信息;
[0089]
在该实施例中,可以将对话文本样本集合随机分成m份互不相交的子集,m为大于或等于3的整数。示例性地,当m=10时,将对话文本数据集随机分成10份互不相交的子集,每次进行模型训练时,使用8份子集作为训练集,1份作为验证集,1份作为测试集。应理解,m还可以设置为其他数值,具体可以根据实际训练需求来确定,本技术实施例不做具体限定。
[0090]
s32,利用训练集、验证集和测试集进行认知障碍检测模型的训练,得到训练后的认知障碍检测模型。
[0091]
在一些实施例中,可以在基于数据流编程的符号数学系统(tensor flow)平台上,利用训练集、验证集和测试集进行认知障碍检测模型的训练进行模型训练。
[0092]
s33,迭代多次进行对话文本样本集合的划分和认知障碍检测模型的训练,得到多个训练后的认知障碍检测模型。
[0093]
示例性地,用于进行训练的模型可以是卷积神经网络(convolutional neural networks,cnn)模型。
[0094]
在一些实施例中,可以在机器学习模型tensorflow平台,配置机器学习模型的模型服务(tensor flow serving)描述文件,tensor flow serving是适用于机器学习模型的灵活、高性能应用系统,通过tensor flow serving可以提供多个训练后的认知障碍检测模型的集成服务,例如通过模型集成(ensemble)的方式将多个训练后的认知障碍检测模型集成为一个训练后的认知障碍检测模型。
[0095]
在本技术实施例中,通过循环迭代的方式对模型训练进行多次训练,可以提高训练得到的认知状态检测模型的准确性。
[0096]
在一些实施例中,步骤s32具体可以包括:
[0097]
s41,利用训练集进行初始认知障碍检测模型训练,得到训练后的初始认知障碍检测模型;s42,在测试集和验证集上对训练后的初始认知障碍检测模型进行性能验证,得到至少一个性能指标值;s43,在性能指标值未达到预设的性能指标合格条件的情况下,对训
练集所包含对话文本样本的标注标签进行重新标注,得到新的训练集;s44,利用新的训练集对训练后的初始认知障碍检测模型继续进行模型训练,直到性能指标值达到预设的性能指标合格条件,得到训练后的认知障碍检测模型。
[0098]
示例性地,至少一个性能指标包括但不限于:精确率(precision)、召回率(call)、f1分数(f1 score)指标中的至少一种。f1分数是统计学中用来衡量二分类模型精确度的一种指标,可以同时兼顾模型训练的精确率和召回率。
[0099]
在该实施例中,训练集用于进行模型训练,验证集和测试集均可以用于对训练后的初始认知障碍检测模型进行性能验证;示例性地,对于验证集的验证结果,若验证结果的准确率未达到准确率未达到预设准确率阈值,则可以对训练后的初始认知障碍检测模型进行模型超参数的调整,例如对网络层数、网络节点数、迭代次数等模型超参数进行调整;测试集的验证结果可以验证训练后的初始认知障碍检测模型的性能,示例性地,若精确率未达到预定准确率阈值,则可以对训练集所包含对话文本样本的标注标签进行重新标注,得到新的训练集,并利用新的训练集继续进行模型训练,直到训练后的初始认知障碍达到预设的性能指标合格条件,得到训练后的认知障碍检测模型,使得训练后的认知障碍检测模型满足性能需求。
[0100]
如图5所示,在一些实施例中,上述步骤s41中,利用训练集进行初始认知障碍检测模型训练,得到训练后的初始认知障碍检测模型,具体可以包括:
[0101]
s51,获取用户对话训练文本,对训练集中的对话文本样本进行分词,得到训练集中的对话文本样本中的词语。
[0102]
s52,根据预设的向量映射关系,获取每个词语、每个语义概念分类标签和每个影响要素标签分别对应的特征向量。
[0103]
s53,将获取的特征向量连接成多个特征向量。
[0104]
在一些实施例中,可以在预先构建的词向量表中查找分词得到的每个词语对应的词向量;在预先构建的标签向量表中查找每个语义概念分类标签对应的特征向量和每个影响要素标签对应的特征向量。
[0105]
示例性地,可以通过查表(look-up)操作进行词向量表的查找操作,查表操作实现为查表操作函数v,查表操作函数v用于将词语映射为对应的词向量,映射后的词向量用于表征该词语所蕴含的意义,例如v(“国王”)≈v(“男”),v(“王后”)≈v(“女”),表示将词语“国王”映射为词语“男”的词向量,将词语“王后”映射为词语“女”的词向量;“国王”与“王后”在语义上的差异与为“男”与“女”在语义上的差异,可以表示为:v(“国王”)-v(“男”)≈v(“男”)
–
v(“女”),即:“国王”与“王后”约等于“男”和“女”对应的词向量的差异。本技术实施例中,通过词向量的映射,可以突出表达出词向量空间中所包含的线性语义关系。
[0106]
在该实施例中,通过表示句子中第i个词对应的k维词向量,长度为n的句子(长度不足时进行填充)可以表示为这里为连接操作符。通常,令x
i:j
表示词xi,x
i+1
,
…
,x
i-1+j
的连接。
[0107]
在该实施例中,x
i:j
可以理解为是一个句子所包含词的词向量的排列,从第一个词的词向量xi的到最后一个词的词向量x
i-1+j
,从前到后进行排列,并通过连接操作符进行连接,即可得到句子的特征向量,简称句子向量。
[0108]
s54,通过词语选择窗口从多个特征向量中进行特征向量选择,得到多个子特征向
量,对多个子特征向量进行卷积操作,得到与每个子特征向量对应的卷积特征。
[0109]
示例性地,可以使用过滤器进行每个子特征向量的卷积操作,例如可以对通过词语选择窗口选择的子特征向量(对应长度为h个词语),应用过滤器生成卷积特征,其中,k表示特征通道数,h表示词语选择窗口中选择的子特征向量对应的词语个数。
[0110]
也就是说,采用尺寸为h的过滤器进行卷积操作,卷积操作的公式ci=f(w
·
x
i:i+h-1
+b),其中ci表示多个子特征向量中的第i个向量,x
i:i+h-1
代表尺寸为h的词语选择窗口,对词语选择窗口中的词x
i:i+h-1
生成卷积特征ci。这里,w为系数矩阵,为偏置项,f为双曲正切函数。过滤器应用到句子中的词窗口{x
1:h
,x
2:h+1
,
…
,x
n-h+1:n
},生成每个词窗口选择的子特征向量的卷积特征c=[c1,c2,
…
,c
n-h+1
]。其中,
[0111]
在该步骤中,可以配置不同尺寸的词语选择窗口,不同尺寸的词语选择窗口对应不同的过滤器。
[0112]
s55,分别对每个子特征向量对应的卷积特征进行池化处理,得到每个子特征向量的新的特征,将池化处理得到的新的特征进行组合,得到句子特征向量。
[0113]
在该步骤中,池化处理用于对每个子特征向量采用时序最大化(max-over-time)操作,该操作用于从各子特征向量中映射获得较为显著的特征,以作为句子特征向量,时序最大化操作可以表示为其中,max{c}表示从每个子特征向量中取最大值作为新的特征,将得到的新的特征作为句子特征向量。
[0114]
本技术实施例中,通过词语选择窗口选择的多个子特征向量,包含了一个词语的特征向量与邻近的其他词语的特征向量,对词语选择窗口选择的多个子特征向量进行卷积,得到的卷积特征可以体现词语的上下文信息,使得卷积得到的特征更加符合上下文语义,有利于提高训练得到的模型的准确性。
[0115]
s56,通过全连接层对句子特征向量进行归一化处理,生成认知状态预测标签。
[0116]
在该步骤中,认知状态预测标签用于预测用户是否具有认知障碍。
[0117]
在一些实施例中,可以构建两层的全连接层感知神经网络(multiple perceptron,mlp),通过归一化softmax操作输出预测标签的概率分布。示例性地,softmax操作可以表示下面的公式(1):
[0118][0119]
在上述公式(1)中,σ(zi)表示预测标签的概率分布,c为输出的预测标签的类别数,k表示滤波器的个数,k的取值决定于词语选择窗口的尺寸数量,假设词语选择窗口的尺寸数量为1,即词语选择窗口只有1种尺寸,则滤波器的个数为1,zi为第i个预测标签的概率值,通过softmax函数就可以将多分类的输出值转换为范围在[0,1]的概率分布。
[0120]
s57,根据认知状态标注标签和认知状态预测标签,构建认知障碍检测模型的损失函数。
[0121]
在该步骤中,可以计算认知状态标注标签和认知状态预测标签之间的交叉熵作为损失函数。交叉熵是信息论中的一个重要概念,主要用于度量两个概率分布间的差异性。
[0122]
s58,利用损失函数调整认知障碍检测模型的模型参数,以利用调整后的模型参数,得到训练后的认知障碍检测模型。
[0123]
在该步骤中,可以通过梯度下降的反向传播算法进行模型参数的更新,例如可以
应用公式通过梯度下降算法更新模型参数θ,其中γ为梯度下降的起始参数,取值接近于1,例如0.9或0.99等用户自定义值。
[0124]
通过上述步骤s51-s57,利用训练集进行初始认知障碍检测模型训练,得到训练后的初始认知障碍检测模型。
[0125]
参照图6,在一些实施例中,利用认知障碍检测提供的认知障碍检测处理包括如下处理流程。
[0126]
s601,获取由用户输入的用户对话信息。
[0127]
s602,对用户对话信息进行分词。
[0128]
s603,将词映射为词向量。
[0129]
在该步骤中,如图6所示,可以通过查找词向量表,确定词表索引与词向量之间的对应关系,从而确定词与词向量之间的对应关系,将词映射为词向量。
[0130]
s604,将词向量输入认知障碍检测模型,得到第一检测结果。
[0131]
s605,确定用户对话信息是否满足由认知障碍检测规则构成的检测条件,得到相应的第二检测结果。
[0132]
在该步骤中,若满足由认知障碍检测规则构成的检测条件,确定该用户存在认知障碍,如不满足,则确定该用户不存在认知障碍。
[0133]
s606,输出检测结果。
[0134]
在该步骤中,可以将第一检测结果和第二检测结果进行加权融合,将融合得到的检测结果作为认知障碍检测结果,并将生成的检测结果通过可视化界面进行展现。
[0135]
在本技术实施例中,可以将认知障碍检测模型输出的检测结果和基于认知障碍检测规则得到的检测结果进行融合,将融合后的输出结果作为最终检测结果,提高认知障碍检测所参考信息的全面性,进一步提高检测结果的准确性。
[0136]
根据本技术实施例的认知障碍检测方法,可以通过日常闲聊的对话交互过程,主动引导用户提供与认知障碍的特征有关的对话信息,基于该用户对话信息进行认知障碍检测,有利于提取隐含在用户对话信息中的认知障碍特征,从而有利于提高认知障碍检测的准确性。
[0137]
可以理解,本技术提及的上述各个方法实施例,在不违背原理逻辑的情况下,均可以彼此相互结合形成结合后的实施例,限于篇幅,本技术不再赘述。本领域技术人员可以理解,在具体实施方式的上述方法中,各步骤的具体执行顺序应当以其功能和可能的内在逻辑确定。
[0138]
此外,本技术还提供了认知障碍检测装置、电子设备、计算机可读存储介质,上述均可用来实现本技术提供的任一种认知障碍检测方法,相应技术方案和描述和参见方法部分的相应记载,不再赘述。
[0139]
图7示出本技术实施例的认知障碍检测装置的结构示意图。如图7所示,本技术实施例的认知障碍检测装置700可以包括如下模块。
[0140]
获取模块710,用于从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,其中,每轮对话交互的对话信息中还包括系统对话信息,系统对话信息用于引导用户提供包含有关联特征信息的用户对话信息,关联特征信息为与认知障碍的特征有关的信息;检测模块720,用于利用认知障碍检测模型对用户对话信息进行认知障碍检测,认知障
碍检测模型用于确定包含有关联特征信息的用户对话信息与认知障碍概率值的对应关系;确定模块730,用于根据认知障碍检测模型输出的认知障碍概率值和预设概率阈值,确定用户是否存在认知障碍,并生成对应的认知障碍检测结果。
[0141]
在一些实施例中,系统对话信息包括系统提问信息,用户对话信息包括用户应答信息;认知障碍检测装置700还包括:交互模块,用于在从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息之前,在与用户的当前一轮对话交互中,输出系统提问信息和接收用户输入的用户应答信息;识别模块,用于识别用户应答信息中包含的特征信息;记录模块,用于记录特征信息和历史对话信息,作为当前对话状态信息,其中,历史对话信息中包含与用户的每轮对话交互的对话信息;主动学习模块,用于通过主动学习的方式,基于当前对话状态信息和预先统计的用户的历史特征行为信息,从预设的关联特征信息中筛选第一关联特征信息;其中,主动学习用于根据对话状态信息和历史特征行为信息确定预设的关联特征信息中的各个关联特征信息的重要程度,第一关联特征信息为重要程度大于预设阈值的关联特征信息;生成模块,用于根据第一关联特征信息生成用于下一轮对话交互的系统提问信息。
[0142]
在一些实施例中,识别模块具体用于:对用户应答信息进行意图识别,得到用户意图信息;从用户应答信息进行实体识别,得到实体信息;对对话信息进行情感分类,得到情感类别信息;将用户意图信息、实体信息和情感类别信息,作为从用户应答信息中识别出的特征信息。
[0143]
在一些实施例中,重要程度与第一关联特征信息的置信度成正比;主动学习模块具体用于:将当前对话状态信息和用户的历史特征行为信息,输入主动学习模型计算预设需要获取的每个关联特征信息的置信度,从预设需要获取的每个关联特征信息中,按照所述置信度从高到低的顺序筛选出至少一个关联特征信息作为第一关联特征信息;其中,主动学习模型用于确定第一关联特征信息的置信度与对话状态信息和特征行为信息的对应关系。
[0144]
在一些实施例中,生成模块,具体用于将第一关联特征信息作为参考信息;将参考信息输入决策模型生成提问信息,其中,决策模型用于确定问答知识库中存储的预定参考信息与提问信息的对应关系;将生成的提问信息作为下一轮对话交互的系统提问信息。
[0145]
在一些实施例中,认知障碍检测装置700还包括:第一结果确定模块,用于在利用认知障碍检测模型对用户对话信息进行认知障碍检测之后,将利用认知障碍检测模型对用户对话信息进行认知障碍检测得到的检测结果作为第一检测结果,第一检测结果用于表示用户是否存在认知障碍;第二结果确定模块,用于按照预设的认知障碍检测规则,对用户对话信息进行认知障碍检测,得到第二检测结果,第二检测结果用于表示所述用户是否存在认知障碍;结果融合模块,用于将第一检测结果和第二检测结果进行融合,将融合得到的检测结果作为认知障碍检测结果,认知障碍检测结果用于表示用户对话信息与认知障碍概率值的对应关系。
[0146]
在一些实施例中,认知障碍检测装置700还包括:模型训练模块,用于在利用认知障碍检测模型对用户对话信息进行认知障碍检测之前,将预先获取的对话文本样本集合划分为m份互不相交的子集,其中,至多m-2个子集为训练集,至少1个子集为验证集,至少1个子集为测试集,每个子集中包括至少1个对话文本样本,m为大于或等于3的整数;其中,训练
集、验证集和测试集中的对话文本样本均包含标注标签,标注标签包括:认知状态标签、语义概念标签和影响要素标签;认知状态标签用于指示是否存在认知障碍,语义概念标签用于指示对话文本样本中的词语的语义分类,影响要素标签用于表示对话文本样本中的关联特征信息;利用训练集、验证集和测试集进行认知障碍检测模型的训练,得到训练后的认知障碍检测模型;迭代多次进行对话文本样本集合的划分和认知障碍检测模型的训练,得到多个训练后的认知障碍检测模型。
[0147]
在一些实施例中,模型训练模块,在用于利用训练集、验证集和测试集进行认知障碍检测模型的训练,得到训练后的认知障碍检测模型时,具体用于:利用训练集进行初始认知障碍检测模型训练,得到训练后的初始认知障碍检测模型;在测试集和验证集上对训练后的初始认知障碍检测模型进行性能验证,得到至少一个性能指标值;在性能指标值未达到预设的性能指标合格条件的情况下,对训练集所包含对话文本样本的标注标签进行重新标注,得到新的训练集;利用新的训练集对训练后的初始认知障碍检测继续进行模型训练,直到性能指标值达到预设的性能指标合格条件,得到训练后的认知障碍检测模型。
[0148]
根据本技术实施例的认知障碍检测装置,可以从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,每轮对话交互的对话信息中还包括系统对话信息,该系统对话信息用于引导用于提供包含有关联特征信息的用户对话信息,即引导用户提供与认知障碍的特征有关的对话信息,然后利用认知障碍检测模型对用户对话信息进行认知障碍检测,得到认知障碍概率值,并根据认知障碍概率值和预设概率阈值确定用户是否存在认知障碍,并生成对应的认知障碍检测结果。根据该装置,用户对话信息中包含的关联特征信息与认知障碍的特征有关,基于该用户对话信息进行认知障碍检测,有利于提取隐含在用户对话信息中的认知障碍特征,从而有利于提高认知障碍检测的准确性。
[0149]
需要明确的是,本发明并不局限于上文实施例中所描述并在图中示出的特定配置和处理。为了描述的方便和简洁,这里省略了对已知方法的详细描述,并且上述描述的系统、模块和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0150]
图8为本技术实施例提供的一种电子设备的框图。
[0151]
参照图8,本技术实施例提供了一种电子设备,该电子设备包括:至少一个处理器801;至少一个存储器802,以及一个或多个i/o接口803,连接在处理器801与存储器802之间;其中,存储器802存储有可被至少一个处理器801执行的一个或多个计算机程序,一个或多个计算机程序被至少一个处理器801执行,以使至少一个处理器801能够执行上述的认知障碍检测方法。
[0152]
本技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,其中,计算机程序在被处理器/处理核执行时实现上述的认知障碍检测方法。计算机可读存储介质可以是易失性或非易失性计算机可读存储介质。
[0153]
本技术实施例还提供了一种计算机程序产品,包括计算机可读代码,或者承载有计算机可读代码的非易失性计算机可读存储介质,当计算机可读代码在电子设备的处理器中运行时,电子设备中的处理器执行上述认知障碍检测方法。
[0154]
本领域普通技术人员可以理解,上文中所公开方法中的全部或某些步骤、系统、装置中的功能模块/单元可以被实施为软件、固件、硬件及其适当的组合。在硬件实施方式中,在以上描述中提及的功能模块/单元之间的划分不一定对应于物理组件的划分;例如,一个
物理组件可以具有多个功能,或者一个功能或步骤可以由若干物理组件合作执行。某些物理组件或所有物理组件可以被实施为由处理器,如中央处理器、数字信号处理器或微处理器执行的软件,或者被实施为硬件,或者被实施为集成电路,如专用集成电路。这样的软件可以分布在计算机可读存储介质上,计算机可读存储介质可以包括计算机存储介质(或非暂时性介质)和通信介质(或暂时性介质)。
[0155]
如本领域普通技术人员公知的,术语计算机存储介质包括在用于存储信息(诸如计算机可读程序指令、数据结构、程序模块或其他数据)的任何方法或技术中实施的易失性和非易失性、可移除和不可移除介质。计算机存储介质包括但不限于随机存取存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom)、静态随机存取存储器(sram)、闪存或其他存储器技术、便携式压缩盘只读存储器(cd-rom)、数字多功能盘(dvd)或其他光盘存储、磁盒、磁带、磁盘存储或其他磁存储装置、或者可以用于存储期望的信息并且可以被计算机访问的任何其他的介质。此外,本领域普通技术人员公知的是,通信介质通常包含计算机可读程序指令、数据结构、程序模块或者诸如载波或其他传输机制之类的调制数据信号中的其他数据,并且可包括任何信息递送介质。
[0156]
这里所描述的计算机可读程序指令可以从计算机可读存储介质下载到各个计算/处理设备,或者通过网络、例如因特网、局域网、广域网和/或无线网下载到外部计算机或外部存储设备。网络可以包括铜传输电缆、光纤传输、无线传输、路由器、防火墙、交换机、网关计算机和/或边缘服务器。每个计算/处理设备中的网络适配卡或者网络接口从网络接收计算机可读程序指令,并转发该计算机可读程序指令,以供存储在各个计算/处理设备中的计算机可读存储介质中。
[0157]
用于执行本技术操作的计算机程序指令可以是汇编指令、指令集架构(isa)指令、机器指令、机器相关指令、微代码、固件指令、状态设置数据、或者以一种或多种编程语言的任意组合编写的源代码或目标代码,编程语言包括面向对象的编程语言—诸如smalltalk、c++等,以及常规的过程式编程语言—诸如“c”语言或类似的编程语言。计算机可读程序指令可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络—包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。在一些实施例中,通过利用计算机可读程序指令的状态信息来个性化定制电子电路,例如可编程逻辑电路、现场可编程门阵列(fpga)或可编程逻辑阵列(pla),该电子电路可以执行计算机可读程序指令,从而实现本技术的各个方面。
[0158]
这里所描述的计算机程序产品可以具体通过硬件、软件或其结合的方式实现。在一个可选实施例中,计算机程序产品具体体现为计算机存储介质,在另一个可选实施例中,计算机程序产品具体体现为软件产品,例如软件开发包(software development kit,sdk)等等。
[0159]
这里参照根据本技术实施例的方法、装置(系统)和计算机程序产品的流程图和/或框图描述了本技术的各个方面。应当理解,流程图和/或框图的每个方框以及流程图和/或框图中各方框的组合,都可以由计算机可读程序指令实现。
[0160]
这些计算机可读程序指令可以提供给通用计算机、专用计算机或其它可编程数据
处理装置的处理器,从而生产出一种机器,使得这些指令在通过计算机或其它可编程数据处理装置的处理器执行时,产生了实现流程图和/或框图中的一个或多个方框中规定的功能/动作的装置。也可以把这些计算机可读程序指令存储在计算机可读存储介质中,这些指令使得计算机、可编程数据处理装置和/或其他设备以特定方式工作,从而,存储有指令的计算机可读介质则包括一个制造品,其包括实现流程图和/或框图中的一个或多个方框中规定的功能/动作的各个方面的指令。
[0161]
也可以把计算机可读程序指令加载到计算机、其它可编程数据处理装置、或其它设备上,使得在计算机、其它可编程数据处理装置或其它设备上执行一系列操作步骤,以产生计算机实现的过程,从而使得在计算机、其它可编程数据处理装置、或其它设备上执行的指令实现流程图和/或框图中的一个或多个方框中规定的功能/动作。
[0162]
附图中的流程图和框图显示了根据本技术的多个实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段或指令的一部分,所述模块、程序段或指令的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个连续的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或动作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
[0163]
本文已经公开了示例实施例,并且虽然采用了具体术语,但它们仅用于并仅应当被解释为一般说明性含义,并且不用于限制的目的。在一些实例中,对本领域技术人员显而易见的是,除非另外明确指出,否则可单独使用与特定实施例相结合描述的特征、特性和/或元素,或可与其他实施例相结合描述的特征、特性和/或元件组合使用。因此,本领域技术人员将理解,在不脱离由所附的权利要求阐明的本技术的范围的情况下,可进行各种形式和细节上的改变。
技术特征:
1.一种认知障碍检测方法,其特征在于,包括:从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,其中,每轮对话交互的对话信息中还包括系统对话信息,所述系统对话信息用于引导所述用户提供包含有关联特征信息的用户对话信息,所述关联特征信息为与认知障碍的特征有关的信息;利用认知障碍检测模型对所述用户对话信息进行认知障碍检测,所述认知障碍检测模型用于确定包含有所述关联特征信息的用户对话信息与认知障碍概率值的对应关系;根据所述认知障碍检测模型输出的认知障碍概率值和预设概率阈值,确定所述用户是否存在认知障碍,并生成对应的认知障碍检测结果。2.根据权利要求1所述的方法,其特征在于,所述系统对话信息包括系统提问信息,所述用户对话信息包括用户应答信息;在所述从至少一轮对话交互的对话信息中获取由所述用户输入的用户对话信息之前,所述方法还包括:在与所述用户的当前一轮对话交互中,输出系统提问信息和接收所述用户输入的用户应答信息;识别所述用户应答信息中包含的特征信息;记录所述特征信息和历史对话信息,作为当前对话状态信息,其中,所述历史对话信息中包含与所述用户的每轮对话交互的对话信息;通过主动学习的方式,基于所述当前对话状态信息和预先统计的所述用户的历史特征行为信息,从预设的关联特征信息中筛选第一关联特征信息;其中,所述主动学习用于根据所述对话状态信息和所述历史特征行为信息确定预设的关联特征信息中的各个关联特征信息的重要程度,所述第一关联特征信息为重要程度大于预设阈值的关联特征信息;根据所述第一关联特征信息生成用于下一轮对话交互的系统提问信息。3.根据权利要求2所述的方法,其特征在于,所述识别所述用户应答信息中包含的特征信息,包括:对所述用户应答信息进行意图识别,得到用户意图信息;从所述用户应答信息进行实体识别,得到实体信息;对所述对话信息进行情感分类,得到情感类别信息;将所述用户意图信息、所述实体信息和所述情感类别信息,作为从所述用户应答信息中识别出的特征信息。4.根据权利要求2所述的方法,其特征在于,所述重要程度与所述第一关联特征信息的置信度成正比;所述通过主动学习的方式,基于当前对话状态信息和预先统计得到的所述用户的历史特征行为信息,从预设的关联特征信息中筛选第一关联特征信息,包括:将当前对话状态信息和所述用户的历史特征行为信息,输入主动学习模型计算预设需要获取的每个关联特征信息的置信度;从所述预设需要获取的每个关联特征信息中,按照所述置信度从高到低的顺序筛选出至少一个关联特征信息作为第一关联特征信息;其中,所述主动学习模型用于确定所述第一关联特征信息的置信度与对话状态信息和特征行为信息的对应关系。5.根据权利要求2所述的方法,其特征在于,所述根据所述第一关联特征信息生成用于下一轮对话交互的系统提问信息,包括:
将所述第一关联特征信息作为参考信息;将所述参考信息输入决策模型生成提问信息,其中,所述决策模型用于确定问答知识库中存储的预定参考信息与提问信息的对应关系;将生成的提问信息作为所述下一轮对话交互的系统提问信息。6.根据权利要求1所述的方法,其特征在于,在所述利用认知障碍检测模型对所述用户对话信息进行认知障碍检测之后,所述方法还包括:将利用认知障碍检测模型对所述用户对话信息进行认知障碍检测得到的检测结果作为第一检测结果,所述第一检测结果用于表示所述用户是否存在认知障碍;按照预设的认知障碍检测规则,对所述用户对话信息进行认知障碍检测,得到第二检测结果,所述第二检测结果用于表示所述用户是否存在认知障碍;将所述第一检测结果和所述第二检测结果进行融合,将融合得到的检测结果作为认知障碍检测结果,所述认知障碍检测结果用于表示所述用户对话信息与认知障碍概率值的对应关系。7.根据权利要求1所述的方法,其特征在于,在利用认知障碍检测模型对所述用户对话信息进行认知障碍检测之前,所述方法还包括:将预先获取的对话文本样本集合划分为m份互不相交的子集,其中,至多m-2个子集为训练集,至少1个子集为验证集,至少1个子集为测试集,每个子集中包括至少1个对话文本样本,m为大于或等于3的整数;其中,所述训练集、验证集和测试集中的对话文本样本均包含标注标签,所述标注标签包括:认知状态标签、语义概念标签和影响要素标签;所述认知状态标签用于指示是否存在认知障碍,语义概念标签用于指示所述对话文本样本中的词语的语义分类,所述影响要素标签用于表示所述对话文本样本中的关联特征信息;利用所述训练集、所述验证集和所述测试集进行认知障碍检测模型的训练,得到训练后的认知障碍检测模型;迭代多次进行所述对话文本样本集合的划分和认知障碍检测模型的训练,得到多个训练后的认知障碍检测模型。8.根据权利要求7所述的方法,其特征在于,所述利用所述训练集、所述验证集和所述测试集进行认知障碍检测模型的训练,得到训练后的认知障碍检测模型,包括:利用所述训练集进行初始认知障碍检测模型训练,得到训练后的初始认知障碍检测模型;在所述测试集和所述验证集上对所述训练后的初始认知障碍检测模型进行性能验证,得到至少一个性能指标值;在所述性能指标值未达到预设的性能指标合格条件的情况下,对所述训练集所包含对话文本样本的标注标签进行重新标注,得到新的训练集;利用所述新的训练集对所述训练后的初始认知障碍检测继续进行模型训练,直到所述性能指标值达到预设的性能指标合格条件,得到训练后的认知障碍检测模型。9.一种认知障碍检测装置,其特征在于,包括:获取模块,用于从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,其中,每轮对话交互的对话信息中还包括系统对话信息,所述系统对话信息用于引导所述
用户提供包含有关联特征信息的用户对话信息,所述关联特征信息为与认知障碍的特征有关的信息;检测模块,用于利用认知障碍检测模型对所述用户对话信息进行认知障碍检测,所述认知障碍检测模型用于确定包含有所述关联特征信息的用户对话信息与认知障碍概率值的对应关系;确定模块,用于根据所述认知障碍检测模型输出的认知障碍概率值和预设概率阈值,确定所述用户是否存在认知障碍,并生成对应的认知障碍检测结果。10.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的一个或多个计算机程序,一个或多个所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1-8中任一项所述的认知障碍检测方法。11.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序在被处理器执行时实现如权利要求1-8中任一项所述的认知障碍检测方法。
技术总结
本申请提供了一种认知障碍检测方法、装置、设备和存储介质,该方法包括:从至少一轮对话交互的对话信息中获取由用户输入的用户对话信息,其中,每轮对话交互的对话信息中还包括系统对话信息,系统对话信息用于引导用户提供包含有关联特征信息的用户对话信息,关联特征信息为与认知障碍的特征有关的信息;利用认知障碍检测模型对用户对话信息进行认知障碍检测,认知障碍检测模型用于确定包含有关联特征信息的用户对话信息与认知障碍概率值的对应关系;根据认知障碍检测模型输出的认知障碍概率值和预设概率阈值,确定用户是否存在认知障碍,并生成对应的认知障碍检测结果。根据本申请的实施例能够提高检测结果的准确性。申请的实施例能够提高检测结果的准确性。申请的实施例能够提高检测结果的准确性。
技术研发人员:白安琪 蒋宁 吴海英 肖冰
受保护的技术使用者:马上消费金融股份有限公司
技术研发日:2023.01.05
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/