一种教学辅助问答平台的搜索方法、系统及电子设备

未命名 09-29 阅读:92 评论:0


1.本发明涉及问答平台技术领域,特别是涉及一种教学辅助问答平台的搜索方法、系统及电子设备。


背景技术:

2.随着教育信息化的深入发展,如何为学生提供个性化、高效的学习服务成为了一个热门研究课题。其中,基于知识图谱的教学辅助问答平台可以将学科知识进行建模,并通过图谱结构的方式进行展示和应用,从而帮助学生快速掌握知识点,提升学习效率,逐渐成为研究的焦点。
3.目前,教学辅助问答平台通过将学科知识建模为知识图谱中的节点,将知识之间的关系建模为边,可以实现知识点之间的关联性和学科知识的多层次展示。这种方法不仅能够方便学生快速掌握知识点,同时还能够帮助教师更好地把握学科知识的结构,为教学内容的优化和改进提供指导。知识图谱的应用还包括课程推荐、个性化学习、智能评估等方面,展现出广阔的应用前景。然而,在实际应用中,由于多目标问答问题的复杂性以及用户不同的学习目的,仅仅依靠知识图谱往往难以取得令人满意的效果。


技术实现要素:

4.本发明的目的是提供一种教学辅助问答平台的搜索方法、系统及电子设备,能够提高教学辅助问答平台中多目标问答问题搜素结果的准确性和合理性。
5.为实现上述目的,本发明提供了如下方案:
6.一种教学辅助问答平台的搜索方法,包括:
7.获取教学辅助数据;
8.将所述教学辅助数据进行结构化处理,并构建知识图谱;
9.获取用户输入的待搜索问题;
10.将所述待搜索问题依次进行分词处理、词性标注处理和实体识别处理;
11.根据实体识别处理的结果确定待搜索问题的类别;
12.基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案。
13.可选的,所述教学辅助数据包括python爬虫和第三方数据库。
14.可选的,将所述教学辅助数据进行结构化处理,并构建知识图谱,包括:
15.将所述教学辅助数据进行结构化,得到教学辅助结构化数据;
16.删除教学辅助结构化数据中的空格;
17.确定教学辅助结构化数据中的多个实体和不同实体间的关系,以及实体属性和关系属性;
18.去除重复实体数据;
19.对含义相同的不同实体进行合并处理;
20.基于所述实体、所述关系、所述实体属性和所述关系属性,构建知识图谱。
21.可选的,基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案,包括:
22.基于待搜索问题的类别构建多目标适应度函数;
23.令迭代次数i=1;
24.初始化初始种群;
25.确定初始种群为第1次迭代时的父代种群;
26.确定第i次迭代时的父代种群中每个个体的多目标适应度函数值;
27.根据第i次迭代时父代种群中每个个体的多目标适应度函数值与解的支配关系,将父代种群中的个体划分为多个层次;
28.计算每个个体在对应层次中的拥挤度;
29.根据每个个体的多目标适应度函数值和拥挤度,利用锦标赛选择方法从第i次迭代时的父代种群中选择多个个体作为第i次迭代时的第一待定子代种群;
30.对所述第一待定子代种群进行交叉变异处理,得到第i次迭代时的第二待定子代种群;
31.将第二待定子代种群与父代种群合并进行非支配排序,确定前预设个数个最优解对应个体为第i次迭代时的子代种群;
32.将第i次迭代时的子代种群作为第i+1次迭代时的父代种群,令迭代次数i的数值增加1,返回步骤“确定第i次迭代时的父代种群中每个个体的多目标适应度函数值”直至迭代次数达到迭代次数阈值,得到第i次迭代时的子代种群对应解为最优解集;
33.根据最优解集在知识图谱中确定待搜索问题的答案。
34.一种教学辅助问答平台的搜索系统,包括:
35.教学辅助数据获取模块,用于获取教学辅助数据;
36.知识图谱构建模块,用于将所述教学辅助数据进行结构化处理,并构建知识图谱;
37.待搜索问题获取模块,用于获取用户输入的待搜索问题;
38.待搜索问题与处理模块,用于将所述待搜索问题依次进行分词处理、词性标注处理和实体识别处理;
39.待搜索问题类别确定模块,用于根据实体识别处理的结果确定待搜索问题的类别;
40.答案确定模块,用于基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案。
41.一种电子设备,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行所述的一种教学辅助问答平台的搜索方法。
42.可选的,所述存储器为可读存储介质。
43.根据本发明提供的具体实施例,本发明公开了以下技术效果:
44.本发明提供的一种教学辅助问答平台的搜索方法、系统及电子设备,获取教学辅助数据;将教学辅助数据进行结构化处理,并构建知识图谱;获取用户输入的待搜索问题;将待搜索问题依次进行分词处理、词性标注处理和实体识别处理;根据实体识别处理的结果确定待搜索问题的类别;基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜
索,确定待搜索问题的答案。本发明通过nsga-ii算法对知识图谱搜索过程进行优化,能够提高教学辅助问答平台中多目标问答问题搜素结果的准确性和合理性。
附图说明
45.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
46.图1为本发明实施例1中教学辅助问答平台的搜索方法流程图;
47.图2为本发明实施例2中教学辅助问答平台的搜索方法原理图;
48.图3为本发明实施例2中教学辅助问答平台运行前运行界面示意图;
49.图4为本发明实施例2中教学辅助问答平台运行后运行界面示意图。
具体实施方式
50.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
51.本发明的目的是提供一种教学辅助问答平台的搜索方法、系统及电子设备,能够提高教学辅助问答平台中多目标问答问题搜素结果的准确性和合理性。
52.为使本发明的上述目的、特征和优点能够更加明显易懂,下面结合附图和具体实施方式对本发明作进一步详细的说明。
53.实施例1
54.如图1所示,本实施例提供了一种教学辅助问答平台的搜索方法,包括:
55.步骤101:获取教学辅助数据。教学辅助数据包括python爬虫和第三方数据库。
56.步骤102:将教学辅助数据进行结构化处理,并构建知识图谱。
57.步骤103:获取用户输入的待搜索问题。
58.步骤104:将待搜索问题依次进行分词处理、词性标注处理和实体识别处理。
59.步骤105:根据实体识别处理的结果确定待搜索问题的类别。
60.步骤106:基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案。
61.步骤102,包括:
62.步骤1021:将教学辅助数据进行结构化,得到教学辅助结构化数据。
63.步骤1022:删除教学辅助结构化数据中的空格。
64.步骤1023:确定教学辅助结构化数据中的多个实体和不同实体间的关系,以及实体属性和关系属性。
65.步骤1024:去除重复实体数据。
66.步骤1025:对含义相同的不同实体进行合并处理。
67.步骤1026:基于实体、关系、实体属性和关系属性,构建知识图谱。
68.步骤106,包括:
69.步骤1061:基于待搜索问题的类别构建多目标适应度函数。
70.步骤1062:令迭代次数i=1。
71.步骤1063:初始化初始种群。
72.步骤1064:确定初始种群为第1次迭代时的父代种群。
73.步骤1065:确定第i次迭代时的父代种群中每个个体的多目标适应度函数值。
74.步骤1066:根据第i次迭代时父代种群中每个个体的多目标适应度函数值与解的支配关系,将父代种群中的个体划分为多个层次。
75.步骤1067:计算每个个体在对应层次中的拥挤度。
76.步骤1068:根据每个个体的多目标适应度函数值和拥挤度,利用锦标赛选择方法从第i次迭代时的父代种群中选择多个个体作为第i次迭代时的第一待定子代种群。
77.步骤1069:对第一待定子代种群进行交叉变异处理,得到第i次迭代时的第二待定子代种群。
78.步骤10610:将第二待定子代种群与父代种群合并进行非支配排序,确定前预设个数个最优解对应个体为第i次迭代时的子代种群。
79.步骤10611:将第i次迭代时的子代种群作为第i+1次迭代时的父代种群,令迭代次数i的数值增加1,返回步骤“确定第i次迭代时的父代种群中每个个体的多目标适应度函数值”直至迭代次数达到迭代次数阈值,得到第i次迭代时的子代种群对应解为最优解集。
80.步骤10612:根据最优解集在知识图谱中确定待搜索问题的答案。
81.实施例2
82.本实施例是对实施例1所述教学辅助问答平台的搜索方法,的具体说明,如图2-图4,搜索方法包括:
83.步骤1:数据结构化,构建知识图谱必须有足够的数据。数据的来源包括但不限于第三方数据库和python爬虫,为了保证数据的质量,必须加以必要的人工干预。对于数据应当进行结构化,方便管理和使用。
84.步骤2:根据特定的情形设计特定的实体定义、关系定义、属性定义。其中,实体定义用来描述知识图谱中的节点,表示具体的事物,实体与实体之间有着明显的区分特征,这里将实体和概念统称为实体;关系定义用来描述不同实体之间的关系,这个关系是有向的、语义化的表示,关系在知识图谱中表现形式为“有向边”;属性定义用来描述关系属性和实体属性,表示关系或者实体之间的多维度特征。
85.步骤3:进行知识融合,处理数据中的等价实体。具体包括:清除数据中的无用符号,如连续空格、重复标点、书名号以及明显不应该出现的符号。使用hash表去除重复出现的实体数据。对于名称等价的多个实体数据融合为一个实体数据,相较于融合前实体数据的变化是拥有更多id。
86.步骤4:对知识图谱进行概念构建,对处理后的数据建立起完善的概念系统,完成知识图谱的雏形。
87.步骤5:基于知识图谱的用户问答系统,主要步骤为:
88.5-1)接受用户在搜索栏输入的语句。
89.5-2)对用户获取到的自然语言进行分析,包括分词、词性标注和实体识别。
90.5-3)用户的学习类型分为3种类型:1、学习某个实体信息;2、了解多个实体之间的关系;3、获得到达实体的学习路径,即获得实体的前驱节点,根据这三种类型将语句再次进行分类:利用集成学习bagging集成模型对语句文本进行分类,从而分析这条语句对应的学习风格。
91.步骤6:根据语句的分类执行对应的查询语句,从知识图谱中搜索到最合适的结果。在这个过程中使用nsga-ii算法进行优化,主要步骤为:
92.6-1)按照步骤5中的第3步可以将用户学习风格进行偏好描述,偏好不同时,目标函数是相同的,都是下面定义的f。这里偏好的不同不是非1级0,而是三种学习风格占比发生变化,因此下面定义的目标函数仍可以描述。综上偏好不同,目标函数不变。具体的做法是定义ltp(learning type preference)=u(li),即用户的学习类型偏好,偏好可以由多个元素组成的一组数据描述。这些元素值之和为1,每个元素代表一种学习类型偏好,如学习路径推荐、实体查询等,某个元素值越大表示这种学习风格更受用户青睐。本发明中主要涉及三类风格。l1、l2、l3分别表示学习某个实体信息;了解多个实体之间的关系;获得到达实体的学习路径。将它们量化,存在约束
93.6-2)定义sk(statement keywords)=u(si),即语句关键词,这里的语句是指用户输入待搜索的语句,其中的关键词是在过滤掉一些无实际意义的停用词基础上进行的提取,关键词通常会包含一些实体名称、关系描述、属性描述等类型的词语。从语句中提取出关键词,这个关键词以语句分词后的实体和关系词组成。
94.6-3)定义函数以minf=min{-f1,f2}为目标函数。sj表示sk中的一个元素,即从语句中提取出的关键词之一。
95.6-4)使用多目标进化算法中的nsga-ii算法进行建模求解,主要步骤如下:
96.step1.初始化种群,种群规模为n,演化代数为t,使用蒙特卡洛算法求出一个较好的种群。
97.step2.对于所有的xi和xj之间的支配与非支配关系,从而进行分层,其中i≠j,若不存在比xi更优的解,那么将xi标记为非支配个体,最后完成非支配排序。
98.step3.评估个体适应度,计算出每个个体的多目标适应度函数值。
99.step4.计算拥挤度,如果个体i比个体j有更优的非支配层,则拥挤度满足i
rank
<j
rank
。当拥有相同等级但是个体i比个体j有更大的拥挤度,则i
rank
=j
rank
,id>jd,id表示个体i的拥挤度。
100.step5.首先将t代产生的种群q
t
和父代f
t
合并成规模为2n的种群p
t
,再使用精英策略从非支配排序后的集合中选取n个最好个体构成p
t+1

101.step6.对p
t+1
种群进行选择、交叉、变异,产生新的子代种群q
t+1

102.step7.判断是否达到演化极限,若没有到达结束条件则返回step3,直至达到条件,快速收敛到pareto最优解集。
103.步骤7:返回结果展示给用户。
104.本发明引入ltp(learningtype preference)和sk(statementkeywords)=u(si)的概念,构造多目标函数,可以确保这样构造的目标函数能更好反映用户在使用教学辅助
型知识图谱下的问答思维;对语句使用nlp相关算法进行分词、词性标注、实体识别的处理,对语句解析更具有准确性;使用nsga-ii算法借助进化算法“优胜劣汰,适者生存”的自然法则,能够更加迅速、准确地搜索到最切合问答语句的节点;针对现有技术存在模型过于复杂、计算量大、运行时间长或是模型过于简单、语句分析度差、返还结果适配性差的问题,本发明不仅具有迅速、准确的特点,也没有过于复杂的模型,更能为用户带来较好的体验;本实施例提供的方法普适性较好,在教学辅助类型的知识图谱中都可以使用本发明提到的方法改善问答系统,实用价值高,兼容性强。
105.实施例3
106.为了执行上述实施例1对应的方法,以实现相应的功能和技术效果,下面提供了一种教学辅助问答平台的搜索系统,包括:
107.教学辅助数据获取模块,用于获取教学辅助数据。
108.知识图谱构建模块,用于将教学辅助数据进行结构化处理,并构建知识图谱。
109.待搜索问题获取模块,用于获取用户输入的待搜索问题。
110.待搜索问题与处理模块,用于将待搜索问题依次进行分词处理、词性标注处理和实体识别处理。
111.待搜索问题类别确定模块,用于根据实体识别处理的结果确定待搜索问题的类别。
112.答案确定模块,用于基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案。
113.实施例4
114.本实施例提供了一种电子设备,包括存储器及处理器,存储器用于存储计算机程序,处理器运行计算机程序以使电子设备执行实施例1所述的一种教学辅助问答平台的搜索方法。其中,存储器为可读存储介质。
115.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其他实施例的不同之处,各个实施例之间相同相似部分互相参见即可。对于实施例公开的系统而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
116.本文中应用了具体个例对本发明的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本发明的方法及其核心思想;同时,对于本领域的一般技术人员,依据本发明的思想,在具体实施方式及应用范围上均会有改变之处。综上所述,本说明书内容不应理解为对本发明的限制。

技术特征:
1.一种教学辅助问答平台的搜索方法,其特征在于,包括:获取教学辅助数据;将所述教学辅助数据进行结构化处理,并构建知识图谱;获取用户输入的待搜索问题;将所述待搜索问题依次进行分词处理、词性标注处理和实体识别处理;根据实体识别处理的结果确定待搜索问题的类别;基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案。2.根据权利要求1所述的一种教学辅助问答平台的搜索方法,其特征在于,所述教学辅助数据包括python爬虫和第三方数据库。3.根据权利要求1所述的一种教学辅助问答平台的搜索方法,其特征在于,将所述教学辅助数据进行结构化处理,并构建知识图谱,包括:将所述教学辅助数据进行结构化,得到教学辅助结构化数据;删除教学辅助结构化数据中的空格;确定教学辅助结构化数据中的多个实体和不同实体间的关系,以及实体属性和关系属性;去除重复实体数据;对含义相同的不同实体进行合并处理;基于所述实体、所述关系、所述实体属性和所述关系属性,构建知识图谱。4.根据权利要求1所述的一种教学辅助问答平台的搜索方法,其特征在于,基于所述待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案,包括:基于待搜索问题的类别构建多目标适应度函数;令迭代次数i=1;初始化初始种群;确定初始种群为第1次迭代时的父代种群;确定第i次迭代时的父代种群中每个个体的多目标适应度函数值;根据第i次迭代时父代种群中每个个体的多目标适应度函数值与解的支配关系,将父代种群中的个体划分为多个层次;计算每个个体在对应层次中的拥挤度;根据每个个体的多目标适应度函数值和拥挤度,利用锦标赛选择方法从第i次迭代时的父代种群中选择多个个体作为第i次迭代时的第一待定子代种群;对所述第一待定子代种群进行交叉变异处理,得到第i次迭代时的第二待定子代种群;将第二待定子代种群与父代种群合并进行非支配排序,确定前预设个数个最优解对应个体为第i次迭代时的子代种群;将第i次迭代时的子代种群作为第i+1次迭代时的父代种群,令迭代次数i的数值增加1,返回步骤“确定第i次迭代时的父代种群中每个个体的多目标适应度函数值”直至迭代次数达到迭代次数阈值,得到第i次迭代时的子代种群对应解为最优解集;根据最优解集在知识图谱中确定待搜索问题的答案。5.一种教学辅助问答平台的搜索系统,其特征在于,包括:
教学辅助数据获取模块,用于获取教学辅助数据;知识图谱构建模块,用于将所述教学辅助数据进行结构化处理,并构建知识图谱;待搜索问题获取模块,用于获取用户输入的待搜索问题;待搜索问题与处理模块,用于将所述待搜索问题依次进行分词处理、词性标注处理和实体识别处理;待搜索问题类别确定模块,用于根据实体识别处理的结果确定待搜索问题的类别;答案确定模块,用于基于待搜索问题的类别,利用nsga-ii算法对知识图谱进行搜索,确定待搜索问题的答案。6.一种电子设备,其特征在于,包括存储器及处理器,所述存储器用于存储计算机程序,所述处理器运行所述计算机程序以使所述电子设备执行权利要求1至4中任一项所述的一种教学辅助问答平台的搜索方法。7.根据权利要求6所述的一种电子设备,其特征在于,所述存储器为可读存储介质。

技术总结
本发明公开了一种教学辅助问答平台的搜索方法、系统及电子设备,涉及问答平台技术领域。本发明获取教学辅助数据;将教学辅助数据进行结构化处理,并构建知识图谱;获取用户输入的待搜索问题;将待搜索问题依次进行分词处理、词性标注处理和实体识别处理;根据实体识别处理的结果确定待搜索问题的类别;基于待搜索问题的类别,利用NSGA-II算法对知识图谱进行搜索,确定待搜索问题的答案。本发明通过NSGA-II算法对知识图谱搜索过程进行优化,能够提高教学辅助问答平台中多目标问答问题搜素结果的准确性和合理性。素结果的准确性和合理性。素结果的准确性和合理性。


技术研发人员:胡雅茹 宋祎磊 吴勇 侯郭天浩 肖锦荣 吴博之 欧俊威 邹娟
受保护的技术使用者:湘潭大学
技术研发日:2023.07.12
技术公布日:2023/9/26
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐