一种呼叫中心非结构化语言解析系统的制作方法
未命名
10-08
阅读:99
评论:0

1.本发明涉及呼叫中心数据处理技术,更具体地说,涉及一种呼叫中心非结构化语言解析系统。
背景技术:
2.目前,由于语音输出的便捷性和高效性均高于文字信息的输出,所以语音交流仍然是解决一些复杂问题的主要交流途径,而较大的服务商以及政务平台都采用呼叫中心完成事务中必要的通讯语音沟通以及语音服务,但是这也产生了一个问题,语音服务如果是人工来提供,则需要较大的成本,而公告号为cn114781401a的专利提出了一种数据处理方法、装置、设备和存储介质,通过机器人通过语音转文本技术把语音信号转换为文本然后进行意图识别,分别对目标对象的互动数据对应的至少两种描述信息进行意图识别,然后将这些识别到的意图进行融合来确定目标对象的互动意图,相比于只基于单一的数据形式比如语音信号来确定互动意图,本技术实施例提供的方案可以综合以不同数据形式表示互动数据的描述数据来确定互动意图,降低了进行互动意图识别时所考虑因素的片面性和局限性,提高了互动意图的识别准确度。通过机器人与对象进行交互,可以大幅度降低人工对语音输出结果的干预,同时从公告号为cn115914468a的智慧燃气呼叫中心的反馈管理方法、物联网系统及介质、公告号为cn115762732a的一种基于区块链的接诊分诊系统、公告号为cn115965508a的一种基于养老服务的智能管理方法及系统都可以发现,呼叫中心智能语义识别已经在政务、医疗、养老等领域得到了较为广泛的应用和普及,而由此也出现一个问题,呼叫中心由于交互及时性的要求,所以在语义识别中很难直接套用现有的语义识别模型,因为现有的语义识别模型需要较大的运行效率,语义识别模型对于标准结构化的信息可以进行快速准确识别,也可以快速确定意图进行语音输出,但是如果语言是非结构化的,那么语义识别模型就需要对语义内容进行非常复杂的运算方式,比对多种外部数据进行学习,所以响应时间就会被拉长,所以对外呼中心而言,需要一类具有较快响应效率的非结构化语言语义解析系统。
技术实现要素:
3.有鉴于此,本发明目的是提供一种呼叫中心非结构化语言解析系统。
4.为了解决上述技术问题,本发明的技术方案是:一种呼叫中心非结构化语言解析系统,包括特征构建模块、环境识别模块、词性识别模块、词性插入模块、语义识别模块、语音输出模块;
5.所述特征构建模块包括文本获取单元、结构提取单元、环境匹配单元以及特征分类单元,所述文本获取单元用于根据历史数据中的历史语音语句的历史语义信息,所述结构提取单元通过预先构建的词性上位模型生成每一历史语义信息的结构化特征,所述环境匹配单元通过历史数据中的语音环境特征标记对应的结构化特征,所述特征分类单元通过聚类分析算法对结构化特征进行分类以将结构化特征划分为若干个环境特征库,每一环境
特征库以语音环境特征为索引;
6.环境识别模块包括环境监测单元以及环境配置单元,所述环境监测单元实时获取语音中的语音环境特征,所述环境配置单元根据语音环境特征确定对应的环境特征库;
7.词性识别模块包括文本转换单元以及词性匹配单元,所述文本转换单元根据实时获取的通讯语音进行文本转换以获取对应的特定解析词,所述词性匹配单元根据所述特定解析词确定对应的上位词性,并根据上位词性在语音文本中的位置关系生成词性匹配特征;
8.词性插入模块包括补全匹配单元、文本组合单元、匹配识别单元以及预先设置的补全匹配库,所述补全匹配库存储有若干补全特征词,每一补全特征词以预设的补全特征条件为索引,所述补全匹配单元根据词性匹配特征与补全特征条件的匹配确定符合条件的补全特征词,所述文本组合单元将补全特征词插入对应的通讯语音文本以生成若干补全文本,所述匹配识别单元根据补全文本和对应的环境特征库匹配以计算每一补全文本和结构化特征的补全匹配值,并将补全匹配值最大的补全文本发送至语义识别模块;
9.所述语义识别模块包括意图分析单元,所述意图分析单元配置有语义识别模型,并用于将接收到的补全文本输入语义识别模型中以获得用户意图信息;
10.所述语音输出模块包括意图反馈单元,所述意图反馈单元根据用户意图信息调取对应的应答语音。
11.进一步地:所述语音输出模块包括有时滞分析单元以及语音缓冲单元,所述时滞分析单元用于根据补全文本计算对应的时滞预测值,所述语音缓冲单元预先配置有若干缓冲语音库,所述缓冲语音库和所述环境特征库具有对应关系,所述缓冲语音库存储有若干缓冲语音,每一缓冲语音以时滞预测值为索引,所述语音缓冲单元根据时滞预测值调取对应的缓冲语音。
12.进一步地:所述特征构建模块包括词性模型单元,所述词性模型单元用于构建所述词性上位模型,所述词性模型单元预先存储有若干词性上位链路,每一词性上位链路对应若干不同的上位链路节点,所述词性模型单元关联每一特定解析词于对应的词性上位节点,以使历史语义数据中该词性上位节点关联的特定解析词出现频次在预设的上位频次范围内,根据特定解析词与词性上位节点的关联关系生成所述的词性上位模型。
13.进一步地:所述词性模型单元通过外部数据库调取每一特定解析词的上位词性,并根据预先配置的词性链路算法计算每一上位词性的上位优先级,并根据上位优先级的大小确定该上位词性在词性上位链路中的位置,同时上位优先级的分布确定对应的上位频次范围。
14.进一步地:所述词性链路算法为其中,p
re
为上位优先级,β1为预设的相似优先权重,β2为预设的相关优先权重,β3为预设的词频优先权重,有β1+β2+β3=1,rf为该特定解析词在外部数据库中与该上位词性关联的频次,δbr为该特定解析词在外部数据库中与该上位词性关联的可靠度均值,e
fn
为该特定解析词的第n个词性近义词在外部数据库中与该上位词性关联的频次,q
wn
为该特定解析词的第n个词性近义词与该特定解析词的相似度,δb
en
为该特定解析词的第n个词性近义词在外部数据库中与该上位词性关联的可靠度均值,k1为该特定解析词的具有的词性近义词的总数,rf为该上位词性关联的所有特定解析词在外部数据库中出现的总频次。
15.进一步地:所述的特征分类单元对应的聚类分析算法为dbscan聚类算法。
16.进一步地:所述的语音环境特征包括音调特征项、音色特征项、地区特征项、接口特征项,所述音调特征项反映语音对应的音调,所述音色特征项反映语音对应的音色,所述地区特征项反映语音用户对应的地区,所述接口特征项反映语音用户通话使用的接口类型。
17.进一步地:所述文本转换单元配置有特定解析库,所述特定解析库存储有若干特定解析词,每一特定解析词预设关联有标准解析语音,所述文本转换单元计算通讯语音中每一特定解析词的解析相关值,并选取解析相关值最大的特定解析词作为该通讯语音对应的特定解析词,有
18.ur=χ1∫|f
re
(x)-f
he
(x)|dx+χ2∫|f
r1
(x)-f
h1
(x)|dx,其中,ur为解析相关值,χ1温为预设的内容解析权重,f
re
(x)为通讯语音对应特定解析词的优化波形,f
he
(x)为标准解析语音中的解析词内容波形,χ2为预设的相关解析权重,f
r1
(x)为通讯语音对应相关部分的优化波形,f
h1
(x)为标准解析语音中的解析词相关波形。
19.进一步地:所述补全特征条件包括缺失词性子条件、缺失时长子条件以及文本关联子条件,所述词性缺失子条件为语音文本中缺失位置的词性与预设的标准词性相同,所述缺失时长子条件为语音文本中缺失位置的时长落入预设的标准时长范围,所述文本关联子条件为语音文本中缺失位置的相邻位置的上位词性与预设的关联词性相同。
20.进一步地:所述匹配识别单元配置有匹配识别算法,所述匹配识别算法为
21.其中,ld为所述补全匹配值,εw为补全文本和最接近的结构化特征的匹配度,ue为最接近的结构化特征的可靠匹配值,所述可靠匹配值与该结构化特征完成匹配的次数正相关,hm为第m个补全特征词与语音文本的匹配度,a
xm
为补全方式对应的补全契合值,a
sm
为第m个补全特征词与补全文本的语义契合值,a
tm
第m个补全特征词与其他补全特征词对应的关联契合值,所述补全契合值、语义契合值以及关联契合值分别通过查询预设的补全特征表获得,k2为补全文本中补全特征词的数量。
22.本发明技术效果主要体现在以下方面:通过这样设置,构建一个根据环境匹配逻辑构建的环境特征库,根据实时产生的通讯语音先将语音分类值对应的环境特征库,然后通过将解析对应的词语进行上位化之后,通过词性补入对应的补全特征词,然后确定需要的补全特征词生成的补全文本输入到对应的语义识别模型中,相比于直接将语音信息输入到语义识别模型中,对语义识别模型的负荷较小,能够更快地确定用户意图,生成应答语音。
附图说明
23.图1:本发明一种呼叫中心非结构化语言解析系统的架构原理图。
24.附图标记:100、特征构建模块;110、文本获取单元;120、结构提取单元;130、环境匹配单元;140、特征分类单元;150、词性模型单元;200、环境识别模块;210、环境监测单元;220、环境配置单元;300、词性识别模块;310、文本转换单元;320、词性匹配单元;400、词性插入模块;410、补全匹配单元;420、文本组合单元;430、匹配识别单元;500、语义识别模块;
510、意图分析单元;600、语音输出模块;610、意图反馈单元;620、时滞分析单元;630、语音缓冲单元。
具体实施方式
25.以下结合附图,对本发明的具体实施方式作进一步详述,以使本发明技术方案更易于理解和掌握。
26.参照图1所示,一种呼叫中心非结构化语言解析系统,包括特征构建模块100、环境识别模块200、词性识别模块300、词性插入模块400、语义识别模块500、语音输出模块600;
27.所述特征构建模块100包括文本获取单元110、结构提取单元120、环境匹配单元130以及特征分类单元140,特征构建模块100用于提前构建对应的环境特征库,以便于根据语音实际使用环境调取对应的语音词性结构。而特征构建模块100会根据样本的丰富不断优化和更新对应的环境特征库,使环境特征和对应的语言结构更加匹配。
28.所述文本获取单元110用于根据历史数据中的历史语音语句的历史语义信息,历史数据需要满足的条件包括具有完整的语音内容且具有完整的历史语义信息,而历史数据可以根据历史对于语音信息的捕获生成也可以根据后台终端输入语音数据样本生成,历史数据的数据量可以决定分类特征库的分类精度和结构化特征的数据粒度。
29.所述结构提取单元120通过预先构建的词性上位模型生成每一历史语义信息的结构化特征,结构化特征是根据词性上位模型构建的,由于每一个历史语义信息都可以有明确的表意,也就是历史语义信息对应的应答语音是较为明确可以设置的,如果和历史语义信息具有相同的结构化特征,那么表意应该也更容易被语义识别模型识别,这样一来,就可以通过结构化特征去作为识别后续信息的依据,具体历史语义信息是通过对信息中的每个特定解析词的上位词性进行获取,然后结构化特征就是上位词性的序列集,例如挪动白色的车,其中挪动、白色以及车都是特定解析词,而挪动的上位词性可以是动词-作用于物-短距离-使物位移,白色的上位词性可以是形容词-颜色,而通过这些上位词性可以确定其他具有同样上位词性的特定解析词,而结构化特征相比与直接语义识别相对而言较为容易,而搭建关于特定业务的词性特征模型需要的数据基础和运算量也相对较小,具体方式如下,所述特征构建模块100包括词性模型单元150,所述词性模型单元150用于构建所述词性上位模型,所述词性模型单元150预先存储有若干词性上位链路,每一词性上位链路对应若干不同的上位链路节点,词性上位链路也就是上位词性之间的关系形成的链路,例如动词中有作用于物和作用于人,那么作用于物和作用于人是两个不同的上位词性,也就分数两个不同的词性上位链路,但是其可以具有动词这一共同的上位链路节点,这样就可以构成一个由上位词性的关系构成的网络,而网络末端是对应的特定解析词,所述词性模型单元150关联每一特定解析词于对应的词性上位节点,以使历史语义数据中该词性上位节点关联的特定解析词出现频次在预设的上位频次范围内,根据特定解析词与词性上位节点的关联关系生成所述的词性上位模型。词性上位模型的对应上位频次范围会变化,所以对应的特定解析词和上位节点的关联关系也会变化,使一个特定解析词汇索引到一个词性上位节点,而上位频次范围的配置依据是,所述词性模型单元150通过外部数据库调取每一特定解析词的上位词性,并根据预先配置的词性链路算法计算每一上位词性的上位优先级,并根据上位优先级的大小确定该上位词性在词性上位链路中的位置,同时上位优先级的分布确
定对应的上位频次范围。上位优先级越高,则说明词频越高,则说明这个上位词性在链路中处于更高的位置,反之,则处于更低的位置,所以根据对于同一特定解析词而言,在其所在的链路中,上位优先级最小的上位词性就是其第一个上级的上位链路节点,上位优先级对应的上位词性的离散程度越高,则其具有越大的上位频次范围,所述词性链路算法为其中,p
re
为上位优先级,β1为预设的相似优先权重,β2为预设的相关优先权重,β3为预设的词频优先权重,有β1+β2+β3=1,rf为该特定解析词在外部数据库中与该上位词性关联的频次,也就是该特定解析词在外部数据库中被解释为上位词性的频次,δbr为该特定解析词在外部数据库中与该上位词性关联的可靠度均值,外部数据库不同、获取平台不同、获取平台给出的可靠性参数不同都会影响一个上位词性和对应特定解析词的可靠度,通过对可靠度求平均数,就可以求出频次均值,从而判断这个特定解析词和上位词性关联的频次,e
fn
为该特定解析词的第n个词性近义词在外部数据库中与该上位词性关联的频次,具体方式是先去调取对应的词性近义词表,获取该特定解析词对应的近义词,判断这个近义词被关联的频次,q
wn
为该特定解析词的第n个词性近义词与该特定解析词的相似度,相似度反映得到的近义词与特定解析词的相似度关系,也就是是否所有场景都可以做近义词的替换,δb
en
为该特定解析词的第n个词性近义词在外部数据库中与该上位词性关联的可靠度均值,原理与特定解析词相同,k1为该特定解析词的具有的词性近义词的总数,rf为该上位词性关联的所有特定解析词在外部数据库中出现的总频次,这个数据反映了上位词性的上位程度。
30.所述环境匹配单元130通过历史数据中的语音环境特征标记对应的结构化特征,由于历史数据中的语音环境特征已知,然后其结构化特征也通过对语义识别后的上位词性模型进行标记,然后上位词性模型就可以确定对应的结构化特征,那么对于样本而言,语音环境特征和结构化特征就完成了关联。
31.所述特征分类单元140通过聚类分析算法对结构化特征进行分类以将结构化特征划分为若干个环境特征库,每一环境特征库以语音环境特征为索引;所述的特征分类单元140对应的聚类分析算法为dbscan聚类算法。由于语音环境特征可以通过赋值进行量化,同时对应的结构化特征也可以进行量化赋值,所以每个样本就可以看做坐标系中的一个节点,这样就可以通过聚类分析算法配置对应的聚类条件将结构化特征和环境特征库进行划分,所述的语音环境特征包括音调特征项、音色特征项、地区特征项、接口特征项,所述音调特征项反映语音对应的音调,所述音色特征项反映语音对应的音色,所述地区特征项反映语音用户对应的地区,所述接口特征项反映语音用户通话使用的接口类型。这些信息都可以作为语音环境特征需要识别的信息,这些信息可以预先进行识别,也可以在前期的通讯语音中识别并捕获。
32.环境识别模块200包括环境监测单元210以及环境配置单元220,
33.所述环境监测单元210实时获取语音中的语音环境特征,环境监测单元210获取语音环境特征,并在语音环境特征变换时,即使做出更新,所以对应不同的语音环境特征就会在用户语音过程中被识别,识别效率快于语义识别,也就是一般在用户语音开始时就可以识别到完整的语音环境特征。
34.所述环境配置单元220根据语音环境特征确定对应的环境特征库;对应的环境数据库的数量决定了对语音环境特征分类的粒度,例如可以对用户的情绪、年龄对应有不同
的语音环境特征,则对应不同的环境特征库,就可以根据不同的语言习惯对用户语音进行预处理识别。
35.词性识别模块300包括文本转换单元310以及词性匹配单元320,
36.所述文本转换单元310根据实时获取的通讯语音进行文本转换以获取对应的特定解析词,所述文本转换单元310配置有特定解析库,所述特定解析库存储有若干特定解析词,每一特定解析词预设关联有标准解析语音,所述文本转换单元310计算通讯语音中每一特定解析词的解析相关值,并选取解析相关值最大的特定解析词作为该通讯语音对应的特定解析词,有
37.ur=χ1∫|f
re
(x)-f
he
(x)|dx+χ2∫|f
r1
(x)-f
h1
(x)|dx,其中,ur为解析相关值,χ1温为预设的内容解析权重,f
re
(x)为通讯语音对应特定解析词的优化波形,也就是用户在输出该语音的对应特定解析词对应的音频信息,f
he
(x)为标准解析语音中的解析词内容波形,也就是标准音频信息,而需要说明的是优化波形是对用户的语音信息通过特征模型、声学模型以及语言模型进行预处理得到优化波形,χ2为预设的相关解析权重,f
r1
(x)为通讯语音对应相关部分的优化波形,f
h1
(x)为标准解析语音中的解析词相关波形。通讯语音的相关部分是只该语音对应的特定解析词前、后对应的相关波形。
38.所述词性匹配单元320根据所述特定解析词确定对应的上位词性,并根据上位词性在语音文本中的位置关系生成词性匹配特征;特定解析词确定后就可以通过上位词性模型就可以确定对应的上位词性,通过语音文本的位置关系就可以生成词性匹配特征,词性匹配特征的数据格式和结构化特征相同。
39.词性插入模块400包括补全匹配单元410、文本组合单元420、匹配识别单元430以及预先设置的补全匹配库,
40.所述补全匹配库存储有若干补全特征词,每一补全特征词以预设的补全特征条件为索引,
41.所述补全匹配单元410根据词性匹配特征与补全特征条件的匹配确定符合条件的补全特征词,所述补全特征条件包括缺失词性子条件、缺失时长子条件以及文本关联子条件,所述词性缺失子条件为语音文本中缺失位置的词性与预设的标准词性相同,所述缺失时长子条件为语音文本中缺失位置的时长落入预设的标准时长范围,所述文本关联子条件为语音文本中缺失位置的相邻位置的上位词性与预设的关联词性相同。如果满足补全特征条件,则说明这个补全特征符合要求,所以就可以得到所有符合要求的补全特征词。
42.所述文本组合单元420将补全特征词插入对应的通讯语音文本以生成若干补全文本,将补全特征词带入补全文本,补全文本的数量就是通讯语音文本的数量相同。
43.所述匹配识别单元430根据补全文本和对应的环境特征库匹配以计算每一补全文本和结构化特征的补全匹配值,并将补全匹配值最大的补全文本发送至语义识别模块500;所述匹配识别单元430配置有匹配识别算法,所述匹配识别算法为
44.其中,ld为所述补全匹配值,εw为补全文本和最接近的结构化特征的匹配度,补全文本和结构化特征的匹配度是根据补全文本对应的词在结构化特征的匹配关系,与对应的上位优先级正相关,ue为最接近的结构化特征的可靠匹配值,所述可靠匹配值与该结构化
特征完成匹配的次数正相关,hm为第m个补全特征词与语音文本的匹配度,a
xm
为第m个补全特征词的补全方式对应的补全契合值,反映补全方式的契合情况,对应每一补全方式具有一决定的补全契合子值,求和对应的契合子值就可以获得补全契合值,a
sm
为第m个补全特征词与补全文本的语义契合值,反映补全后的语义契合情况,文本越符合用语习惯,则语义契合值越大,a
tm
第m个补全特征词与其他补全特征词对应的关联契合值,反映补全特征词之间的契合情况,补全特征词之间的重合度越低,关联契合值就越高,所述补全契合值、语义契合值以及关联契合值分别通过查询预设的补全特征表获得,k2为补全文本中补全特征词的数量。
45.所述语义识别模块500包括意图分析单元510,所述意图分析单元510配置有语义识别模型,并用于将接收到的补全文本输入语义识别模型中以获得用户意图信息;语义识别模型再此不做赘述,通过补全文本识别用户意图信息,可以选择的用户意图信息预先配置,然后通过语义识别模型可以定位在这个业务属性下对应的语义。
46.所述语音输出模块600包括意图反馈单元610,所述意图反馈单元610根据用户意图信息调取对应的应答语音。所述语音输出模块600包括有时滞分析单元620以及语音缓冲单元630,
47.所述时滞分析单元620用于根据补全文本计算对应的时滞预测值,计算方式可以计算补全文本的文本长度或者补全特征词的历史使用频次,以及特定关键词出现的频次,就可以提前预判识别所需要的时间,从而判断反馈信息是否会产生时滞,所述语音缓冲单元630预先配置有若干缓冲语音库,所述缓冲语音库和所述环境特征库具有对应关系,所述缓冲语音库存储有若干缓冲语音,每一缓冲语音以时滞预测值为索引,所述语音缓冲单元630根据时滞预测值调取对应的缓冲语音。通过时滞预测值可以调取对应的缓冲语音,通过时滞预测值可以获取对应的缓冲语音,这样通过缓冲语音保证对话的流畅性。
48.当然,以上只是本发明的典型实例,除此之外,本发明还可以有其它多种具体实施方式,凡采用等同替换或等效变换形成的技术方案,均落在本发明要求保护的范围之内。
技术特征:
1.一种呼叫中心非结构化语言解析系统,其特征在于:包括特征构建模块、环境识别模块、词性识别模块、词性插入模块、语义识别模块、语音输出模块;所述特征构建模块包括文本获取单元、结构提取单元、环境匹配单元以及特征分类单元,所述文本获取单元用于根据历史数据中的历史语音语句的历史语义信息,所述结构提取单元通过预先构建的词性上位模型生成每一历史语义信息的结构化特征,所述环境匹配单元通过历史数据中的语音环境特征标记对应的结构化特征,所述特征分类单元通过聚类分析算法对结构化特征进行分类以将结构化特征划分为若干个环境特征库,每一环境特征库以语音环境特征为索引;环境识别模块包括环境监测单元以及环境配置单元,所述环境监测单元实时获取语音中的语音环境特征,所述环境配置单元根据语音环境特征确定对应的环境特征库;词性识别模块包括文本转换单元以及词性匹配单元,所述文本转换单元根据实时获取的通讯语音进行文本转换以获取对应的特定解析词,所述词性匹配单元根据所述特定解析词确定对应的上位词性,并根据上位词性在语音文本中的位置关系生成词性匹配特征;词性插入模块包括补全匹配单元、文本组合单元、匹配识别单元以及预先设置的补全匹配库,所述补全匹配库存储有若干补全特征词,每一补全特征词以预设的补全特征条件为索引,所述补全匹配单元根据词性匹配特征与补全特征条件的匹配确定符合条件的补全特征词,所述文本组合单元将补全特征词插入对应的通讯语音文本以生成若干补全文本,所述匹配识别单元根据补全文本和对应的环境特征库匹配以计算每一补全文本和结构化特征的补全匹配值,并将补全匹配值最大的补全文本发送至语义识别模块;所述语义识别模块包括意图分析单元,所述意图分析单元配置有语义识别模型,并用于将接收到的补全文本输入语义识别模型中以获得用户意图信息;所述语音输出模块包括意图反馈单元,所述意图反馈单元根据用户意图信息调取对应的应答语音。2.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述语音输出模块包括有时滞分析单元以及语音缓冲单元,所述时滞分析单元用于根据补全文本计算对应的时滞预测值,所述语音缓冲单元预先配置有若干缓冲语音库,所述缓冲语音库和所述环境特征库具有对应关系,所述缓冲语音库存储有若干缓冲语音,每一缓冲语音以时滞预测值为索引,所述语音缓冲单元根据时滞预测值调取对应的缓冲语音。3.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述特征构建模块包括词性模型单元,所述词性模型单元用于构建所述词性上位模型,所述词性模型单元预先存储有若干词性上位链路,每一词性上位链路对应若干不同的上位链路节点,所述词性模型单元关联每一特定解析词于对应的词性上位节点,以使历史语义数据中该词性上位节点关联的特定解析词出现频次在预设的上位频次范围内,根据特定解析词与词性上位节点的关联关系生成所述的词性上位模型。4.如权利要求3所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述词性模型单元通过外部数据库调取每一特定解析词的上位词性,并根据预先配置的词性链路算法计算每一上位词性的上位优先级,并根据上位优先级的大小确定该上位词性在词性上位链路中的位置,同时上位优先级的分布确定对应的上位频次范围。5.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述词性链
路算法为其中,p
re
为上位优先级,β1为预设的相似优先权重,β2为预设的相关优先权重,β3为预设的词频优先权重,有β1+β2+β3=1,r
f
为该特定解析词在外部数据库中与该上位词性关联的频次,δb
r
为该特定解析词在外部数据库中与该上位词性关联的可靠度均值,e
fn
为该特定解析词的第n个词性近义词在外部数据库中与该上位词性关联的频次,q
wn
为该特定解析词的第n个词性近义词与该特定解析词的相似度,δb
en
为该特定解析词的第n个词性近义词在外部数据库中与该上位词性关联的可靠度均值,k1为该特定解析词的具有的词性近义词的总数,r
f
为该上位词性关联的所有特定解析词在外部数据库中出现的总频次。6.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述的特征分类单元对应的聚类分析算法为dbscan聚类算法。7.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述的语音环境特征包括音调特征项、音色特征项、地区特征项、接口特征项,所述音调特征项反映语音对应的音调,所述音色特征项反映语音对应的音色,所述地区特征项反映语音用户对应的地区,所述接口特征项反映语音用户通话使用的接口类型。8.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述文本转换单元配置有特定解析库,所述特定解析库存储有若干特定解析词,每一特定解析词预设关联有标准解析语音,所述文本转换单元计算通讯语音中每一特定解析词的解析相关值,并选取解析相关值最大的特定解析词作为该通讯语音对应的特定解析词,有u
r
=χ1∫|f
re
(x)-f
he
(x)|dx+χ2∫|f
r1
(x)-f
h1
(x)|dx,其中,u
r
为解析相关值,χ1温为预设的内容解析权重,f
re
(x)为通讯语音对应特定解析词的优化波形,f
he
(x)为标准解析语音中的解析词内容波形,χ2为预设的相关解析权重,f
r1
(x)为通讯语音对应相关部分的优化波形,f
h1
(x)为标准解析语音中的解析词相关波形。9.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述补全特征条件包括缺失词性子条件、缺失时长子条件以及文本关联子条件,所述词性缺失子条件为语音文本中缺失位置的词性与预设的标准词性相同,所述缺失时长子条件为语音文本中缺失位置的时长落入预设的标准时长范围,所述文本关联子条件为语音文本中缺失位置的相邻位置的上位词性与预设的关联词性相同。10.如权利要求1所述的一种呼叫中心非结构化语言解析系统,其特征在于:所述匹配识别单元配置有匹配识别算法,所述匹配识别算法为,其中,l
d
为所述补全匹配值,ε
w
为补全文本和最接近的结构化特征的匹配度,u
e
为最接近的结构化特征的可靠匹配值,所述可靠匹配值与该结构化特征完成匹配的次数正相关,h
m
为第m个补全特征词与语音文本的匹配度,a
xm
为第m个补全特征词的补全方式对应的补全契合值,a
sm
为第m个补全特征词与补全文本的语义契合值,a
tm
第m个补全特征词与其他补全特征词对应的关联契合值,所述补全契合值、语义契合值以及关联契合值分别通过查询预设的补全特征表获得,k2为补全文本中补全特征词的数量。
技术总结
本发明涉及一种呼叫中心非结构化语言解析系统,包括特征构建模块、环境识别模块、词性识别模块、词性插入模块、语义识别模块、语音输出模块;构建一个根据环境匹配逻辑构建的环境特征库,根据实时产生的通讯语音先将语音分类值对应的环境特征库,然后通过将解析对应的词语进行上位化之后,通过词性补入对应的补全特征词,然后确定需要的补全特征词生成的补全文本输入到对应的语义识别模型中,相比于直接将语音信息输入到语义识别模型中,对语义识别模型的负荷较小,能够更快地确定用户意图,生成应答语音。应答语音。应答语音。
技术研发人员:赵蕊 李该
受保护的技术使用者:深圳市小麦飞扬科技有限公司
技术研发日:2023.07.04
技术公布日:2023/10/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/