医疗古文推荐方法、装置、电子设备及介质与流程

未命名 09-03 阅读:87 评论:0


1.本发明涉及数字医疗领域,尤其涉及一种医疗古文推荐方法、装置、电子设备及可读存储介质。


背景技术:

2.在医疗领域中,当遇到一些复杂的疾病问题时,用户需要查询一些医学类的古文。
3.目前常见的中医古文推荐方式多为根据用户搜索的关键词,提供该用户含有关键词的古文,并没有考虑到古文内容是否与关键词相关,除此之外,此种中医古文推荐方法,没有考虑用户的真正需求,因此,容易造成中医文献古文推荐准确率不高的技术问题。


技术实现要素:

4.本发明提供一种医疗古文推荐方法、装置、电子设备及可读存储介质,其目的在于提高医学工作者查找相关医学类古文时,中医古文推荐的准确率。
5.为实现上述目的,本发明提供的一种医疗古文推荐方法,所述方法包括:
6.接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,
7.分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文;
8.利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文;
9.将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据;
10.根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签;
11.根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率;
12.根据所述用户点击率的大小顺序,输出所述待推荐医学古文。
13.可选地,所述根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签,包括:
14.利用预设的语言表征模型分别提取所述古文译文拼接数据及所述古文注解拼接数据的特征数据,得到译文特征向量及注解特征向量;
15.拼接所述译文特征向量及所述注解特征向量,得到译文注解拼接向量,并对所述译文注解拼接向量进行线性转换,得到线性特征向量;
16.对所述线性特征向量进行归一化处理,得到标签特征向量,并根据所述标签特征向量的向量维度与预设标签的映照关系,得到所述待推荐医学古文的古文标签。
17.可选地,所述利用预设的语言表征模型分别提取所述古文译文拼接数据及所述古文注解拼接数据的特征数据,得到译文特征向量及注解特征向量,包括:
18.对所述古文译文拼接数据进行向量化处理,得到古文译文拼接文本向量,以及对所述古文注解拼接数据进行向量化处理,得到古文注解拼接文本向量;
19.利用预设的语言表征模型中注意力机制模块的不同分类层参数矩阵分别对所述古文译文拼接文本向量进行线性变换,得到古文译文查询向量、古文译文关键向量及古文译文数值向量;
20.利用所述分类层参数矩阵分别对所述古文注解拼接文本向量进行线性变换,得到古文注解查询向量、古文注解关键向量及古文注解数值向量;
21.利用所述注意力机制模块中的归一化指数函数对所述古文译文查询向量、所述古文译文关键向量及所述古文译文数值向量进行计算,得到古文译文权重向量;
22.利用所述归一化指数函数对所述古文注解查询向量、所述古文注解关键向量及所述古文注解数值向量进行计算,得到古文注解权重向量;
23.利用所述语言表征模型中的解码模块分别对所述古文译文权重向量及所述古文注解权重向量进行解码,得到译文特征向量及注解特征向量。
24.可选地,所述对所述古文译文拼接数据进行向量化处理,得到古文译文拼接文本向量:
25.对所述古文译文拼接数据进行文本编码,得到古文译文拼接向量;
26.对所述古文译文拼接数据的每一个文字进行位置索引编码,得到古文译文拼接位置编码;
27.根据所述古文译文拼接向量与所述古文译文拼接位置编码,得到古文译文拼接文本向量。
28.可选地,所述对所述线性特征向量进行归一化处理,得到标签特征向量,包括:
29.将所述线性特征向量与预设标签参数矩阵进行叉乘,得到目标线性特征向量;
30.将所述目标线性特征向量与预设标签参数向量进行相加,得到目标特征向量;
31.利用预设激活函数对所述目标特征向量进行归一化计算,得到标签特征向量。
32.可选地,所述分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征中的提取所述用户信息的特征信息,得到用户特征,包括:
33.对所述用户信息进行单词提取,得到信息词袋;
34.对所述用户信息进行分句处理,得到用户信息分句;
35.根据所述信息词袋中每个单词的先后顺序及所述用户信息分句中出现的单词,对所述用户信息分句进行编码,得到所述用户信息分词语句特征;
36.将所述用户信息分词语句特征进行拼接,得到用户特征。
37.可选地,所述根据所述用户信息、所述待推荐医学古文的译文特征向量、注解特征向量及标签结果,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率,包括:
38.获取所述待推荐医学古文的译文特征向量、注解特征向量;
39.将所述待推荐医学古文的译文特征向量、注解特征向量及标签结果进行拼接,得到古文特征向量;
40.利用预设的医学古文推荐模型中的编码器对所述用户信息进行编码,得到用户编码向量;
41.利用所述医学古文推荐模型中注意力机制层的归一化指数函数对所述用户编码向量及所述古文特征向量进行计算,得到理想古文向量;
42.计算所述古文特征向量与所述理想古文向量的相似度,并根据预设的相似度点击率转换规则,将所述相似度转换为所述待推荐医学古文的用户点击率。
43.为了解决上述问题,本发明还提供一种医疗古文推荐装置,所述装置包括:
44.古文拼接模块,用于接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文,利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文,将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据;
45.古文标签模块,用于根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签;
46.医学古文推荐模块,用于根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率,根据所述用户点击率的大小顺序,输出所述待推荐医学古文。
47.为了解决上述问题,本发明还提供一种电子设备,所述电子设备包括:
48.存储器,存储至少一个计算机程序;及
49.处理器,执行所述存储器中存储的计算机程序以实现上述所述的医疗古文推荐方法。
50.为了解决上述问题,本发明还提供一种计算机可读存储介质,所述计算机可读存储介质中存储有至少一个计算机程序,所述至少一个计算机程序被电子设备中的处理器执行以实现上述所述的医疗古文推荐方法。
51.本发明实施例通过古文数据、译文数据及注解数据之间的关系,对古文数据进行标签,得到所有古文数据的标签结果,从而使得医学古文推荐系统能够更好的根据用户需求推荐给用户需要的古文,从而提高医学古文推荐的准确率,除此之外,本发明将所述待推荐医学古文的标签信息融入至预设的医学古文推荐模型中,使得所述医学古文推荐模型的准确率更高,进一步提高了医学古文推荐的准确率。因此,本发明提供的一种医学古文推荐方法、装置、设备及存储介质,能够提高医学工作者查找相关医学类古文时,医学古文推荐的准确率,从而帮助医学工作者解决所碰到的疑难杂症,提高疾病的解决效率。
附图说明
52.图1为本发明一实施例提供的医疗古文推荐方法的流程示意图;
53.图2至图3为本发明一实施例提供的医疗古文推荐方法的中其中一个步骤的详细实施流程图;
54.图4为本发明一实施例提供的医疗古文推荐装置的模块示意图;
55.图5为本发明一实施例提供的实现医疗古文推荐方法的电子设备的内部结构示意图;
56.本发明目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
57.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
58.本发明实施例提供一种医疗古文推荐方法。所述医疗古文推荐方法的执行主体包括但不限于服务端、终端等能够被配置为执行本技术实施例提供的该方法的电子设备中的至少一种。换言之,所述医疗古文推荐方法可以由安装在终端设备或服务端设备的软件或硬件来执行,所述软件可以是区块链平台。所述服务端可以包括独立的服务器,也可以包括提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、内容分发网络(content delivery network,cdn)、以及大数据和人工智能平台等基础云计算服务的云服务器。
59.参照图1所示的本发明一实施例提供的医疗古文推荐方法的流程示意图,在本发明实施例中,所述医疗古文推荐方法包括:
60.s1、接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,并根据所述搜索关键词及所述用户信息,筛选待推荐医学古文。
61.本发明实施例中,所述搜索关键词可以是医学类古文献中出现的字或词组,例如:虚邪、精神内守及嗜欲等。所述用户信息包括基本信息、用户行为及用户画像,其中,所述基本信息包含姓名、性别、年龄及爱好等,所述用户行为可以是用户在网络中的操作行为,一般采用python爬虫可以爬取得到,所述用户画像包含用户的属性、行为及期待等内容。
62.本发明一可选实施例中,当接受到用户输入的搜索关键词时,通过python爬虫爬取所述用户在医学平台上的用户行为及基本信息,并根据所述用户的用户行为及基本信息生成用户画像。
63.s2、分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文。
64.本发明实施例中,所述用户特征包含用户行为序列,用户图像序列及基本信息序列等。所述预设产品库可以是包含大量医学类古文数据的数据库。
65.本发明实施例中,通过分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,进一步地,将关键词特征及用户特征所述与预设产品库中的古文进行匹配,找到大致相符的古文数据,从而实现古文数据的初步筛选,减少了古文的搜索范围,提高了的医疗古文推荐的效率。
66.进一步地,作为本发明一可选实施例,参考图2所示,所述提取所述用户信息的特征信息,得到用户特征,包括:
67.s21、对所述用户信息进行单词提取,得到信息词袋;
68.s22、对所述用户信息进行分句处理,得到用户信息分句;
69.s23、根据所述信息词袋中每个单词的先后顺序及所述用户信息分句中出现的单词,对所述用户信息分句进行编码,得到所述用户信息分词语句特征;
70.s24、将所述用户信息分词语句特征进行拼接,得到用户特征。
71.本发明实施例中,所述词袋可以是不重复单词的集合。
72.本发明一可选实施例中,获取到的用户信息为“他是一名实习医生,他喜欢用浏览器查看医学古文”,通过对用户信息进行单词提取得到的信息词袋为(他,是,一名,实习,医
生,喜欢,用,浏览器,查看,医学,古文),并根据所述信息词袋中单词的数量,定义一个词袋序列(0,0,0,0,0,0,0,0,0,0,0),进一步地,对用户信息进行分句处理,得到“他是一名实习医生”及“他喜欢用浏览器查看医学古文”两句话,其次,根据所述信息词袋中每个单词的先后顺序及所述用户信息分句中出现的单词,对所述用户信息分句进行编码可以表现为“他是一名实习医生”对应的特征编码为(1,1,1,1,1,0,0,0,0,0,0),“他喜欢用浏览器查看医学古文”对应的特征编码为(1,0,0,0,0,1,1,1,1,1,1),最后,将特征编码(1,1,1,1,1,0,0,0,0,0,0)(1,0,0,0,0,1,1,1,1,1,1)进行拼接,得到用户特征编码。
73.本发明另一可选实施例中,提取所述搜索关键词的特征信息与所述提取所述用户信息的特征信息,得到用户特征类似,故此不赘述。
74.s3、利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文。
75.本发明实施例中,所述粗排算法可以是一种减少召回古文数量的,以保证后续注意力机制能够顺利运行的算法。
76.本发明一可选实施例中,通过对召回古文进行粗排计算,进一步筛选出更符合用户要求的医学古文,从而保证的医疗古文推荐的准确率,另一方面,减少了推荐模型的计算量,从而提高了推荐模型的效率。
77.s4、将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据。
78.本发明实施例中,所述待推荐医学古文可以是当前互联网中能够被查找到的医学类古代文献或医学类古诗词等,例如,《黄帝内经》、《伤寒杂病论》等古代文献。所述译文数据可以是当前互联网中对医学类古代文献中各语句进行翻译,得到的白话文数据。所述注解数据可以是当前互联网中对医学类古代文献中较为难以理解的字词句进行批注解释的语句。
79.本发明可选实施例中,可以通过网络查找或爬取的方式获取待推荐医学类古文数据对应的医学类译文数据及医学类注解数据,例如,在医学领域,可以通过关键词“精神内守”及“嗜欲”在互联网中查找相关医学类古文数据,能够查找到《黄帝内经》,,使得用户在查询古文数据时能够轻松获取所需古文,进而提高了医疗古文推荐的效率。
80.进一步地,本发明实施例为了更好地表现待推荐医学古文与译文数据及注解数据之间的关系,将所述待推荐医学古文与所述译文数据拼接,得到古文译文拼接数据,以及将所述待推荐医学古文与所述注解数据拼接,得到古文注解拼接数据,从而提高待推荐了古文数据与译文数据及注解数据之间的关联性,使得医疗古文推荐更为精准。
81.s5、根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签。
82.本发明实施例中,根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,确定了所述待推荐医学古文的古文标签,使得医疗古文推荐更为准确,提高了医疗古文推荐的精准度。
83.详细地,参考图3所示,所述根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签,包括:
84.s51、利用预设的语言表征模型分别提取所述古文译文拼接数据及所述古文注解拼接数据的特征数据,得到译文特征向量及注解特征向量;
85.s52、拼接所述译文特征向量及所述注解特征向量,得到译文注解拼接向量,并对所述译文注解拼接向量进行线性转换,得到线性特征向量;
86.s53、对所述线性特征向量进行归一化处理,得到标签特征向量,并根据所述标签特征向量的向量维度与预设标签的映照关系,得到所述待推荐医学古文的古文标签。
87.本发明实施例中,本发明实施例中,所述预设的语言表征模型可以是训练完成的bert(bidirectionalencoder representations fromtransformer,基于变压器的双向编码器表示)模型。所述预设标签可以是根据工作人员的工作领域进行设定的古文标签,例如,在医学领域中,预设标签可以是按人体部位作为预设标签的划分标准,也可以按内科外科作为预设标签的划分标准。
88.进一步地,所述利用预设的语言表征模型分别提取所述古文译文拼接数据及所述古文注解拼接数据的特征数据,得到译文特征向量及注解特征向量,包括:
89.对所述古文译文拼接数据进行向量化处理,得到古文译文拼接文本向量,以及对所述古文注解拼接数据进行向量化处理,得到古文注解拼接文本向量;
90.利用预设的语言表征模型中注意力机制模块的不同分类层参数矩阵分别对所述古文译文拼接文本向量进行线性变换,得到古文译文查询向量、古文译文关键向量及古文译文数值向量;
91.利用所述分类层参数矩阵分别对所述古文注解拼接文本向量进行线性变换,得到古文注解查询向量、古文注解关键向量及古文注解数值向量;
92.利用所述注意力机制模块中的归一化指数函数对所述古文译文查询向量、所述古文译文关键向量及所述古文译文数值向量进行计算,得到古文译文权重向量;
93.利用所述归一化指数函数对所述古文注解查询向量、所述古文注解关键向量及所述古文注解数值向量进行计算,得到古文注解权重向量;
94.利用所述语言表征模型中的解码模块分别对所述古文译文权重向量及所述古文注解权重向量进行解码,得到译文特征向量及注解特征向量。
95.本发明实施例中,所述分类层参数矩阵可以是bert模型中经过多次训练调优得到的。
96.本发明可选实施例中,由于模型输入端口只能够接收向量形式的输入,因此,在利用预设的语言表征模型分别提取所述古文译文拼接数据及所述古文注解拼接数据的特征数据之前,还需要将所述古文译文拼接数据及所述古文注解拼接数据转化为向量形式的数据。
97.详细地,作为本发明一可选实施例,采用下述方法对所述古文译文拼接数据进行向量化处理,得到古文译文拼接文本向量:
98.对所述古文译文拼接数据进行文本编码,得到古文译文拼接向量;
99.对所述古文译文拼接数据的每一个文字进行位置索引编码,得到古文译文拼接位置编码;
100.根据所述古文译文拼接向量与所述古文译文拼接位置编码,得到古文译文拼接文本向量。
101.本发明实施例中,对所述古文注解拼接数据进行向量化处理,得到古文注解拼接文本向量的方法与上述对所述古文译文拼接数据进行向量化处理,得到古文译文拼接文本
向量相似,这里不再赘述。
102.本发明实施例中,所述古文译文拼接向量及所述古文注解拼接向量分别用于刻画古文译文拼接数据及古文注解拼接数据的全局语义信息,并与古文译文拼接数据及古文注解拼接数据中的单字/词的语义信息相融合。所述古文译文拼接位置编码及所述古文注解拼接位置编码分别用于区分所述古文译文拼接数据及古文注解拼接数据中的单字/词所在的位置。
103.本发明可选实施例中,由于出现在文本不同位置的字/词所携带的语义信息存在差异,例如:“我爱你”和“你爱我”,因此,在对所述古文译文拼接数据及所述古文注解拼接数据进行向量化处理之后,还需要对所述古文译文拼接数据及所述古文注解拼接数据不同位置的字/词分别附加一个不同的向量以作区分。
104.进一步地,本发明一可选实施例中,通过向量拼接的方式,将所述译文特征向量与所述注解特征向量进行拼接,从而获取所述译文特征向量与所述注解特征向量之间的关联性,从而提高标签的准确率,提高医疗古文推荐的准确率。
105.本发明实施例中,可以利用训练完成的语言表征模型中的线性层参数对所述译文注解拼接向量进行线性转换。
106.本发明另一可选实施例中,通过将译文注解拼接向量与线性层参数进行叉乘,从而实现译文注解拼接向量的线性转换。
107.进一步地,作为本发明一可选实施例,所述对所述线性特征向量进行归一化处理,得到标签特征向量,包括:
108.将所述线性特征向量与预设标签参数矩阵进行叉乘,得到目标线性特征向量;
109.将所述目标线性特征向量与预设标签参数向量进行相加,得到目标特征向量;
110.利用预设激活函数对所述目标特征向量进行归一化计算,得到标签特征向量。
111.本发明实施例中,所述预设标签参数矩阵可以是维度为k*m的矩阵,其中k可以是预设标签的个数,m可以是译文特征向量及注解特征向量的向量维度。所述预设标签参数向量可以是维度为k维的向量。所述预设激活函数可以是softmax函数。
112.进一步地,本发明一可选实施例中,可以利用下述公式计算所述标签特征向量:
113.s=softmax(md+b)
114.其中,s指的是所述标签特征向量,softmax指的是所述预设激活函数,m指的是维度为k*m的所述预设矩阵,d指的是所述线性特征向量,b指的是维度为k的所述预设向量。
115.本发明一可选实施例中,当计算出所述标签特征向量的表达式之后,根据所述标签特征向量中每一个维度的向量值确定所述标签特征向量对应古文的标签,从而实现将多标签信息融合到推荐模型中,使得推荐模型准确率更高,即提高了医疗古文推荐的成功率。
116.s6、根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率。
117.本发明实施例中,所述预设的医学古文推荐模型可以是产品推荐中常见的双塔模型,包括user塔和item塔,其中所述user塔及所述item塔都包含编码器。
118.本发明一可选实施例中,所述医学古文推荐模型能够应用于多种不同的领域中,如:的医学古文推荐、常见古诗词推荐等。
119.本发明一可选实施例中,可以在预设语言表征模型输出数据库中搜寻所述待推荐
医学古文的译文特征向量、注解特征向量,减少了数据编码过程,从而提高了医疗古文推荐效率。
120.进一步地,本发明实施例根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率,实现将多标签信息融入到医学古文推荐模型中,使得医学古文推荐模型准确率更高,提高了医学古文推荐的准确率。
121.详细地,作为本发明一可选实施例,所述根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率,包括:
122.获取所述待推荐医学古文的译文特征向量、注解特征向量;
123.将所述待推荐医学古文的译文特征向量、注解特征向量及古文标签进行拼接,得到古文特征向量;
124.利用预设的医学古文推荐模型中的编码器对所述用户信息进行编码,得到用户编码向量;
125.利用所述医学古文推荐模型中注意力机制层的归一化指数函数对所述用户编码向量及所述古文特征向量进行计算,得到理想古文向量;
126.计算所述古文特征向量与所述理想古文向量的相似度,并根据预设的相似度点击率转换规则,将所述相似度转换为所述待推荐医学古文的用户点击率。
127.本发明实施例中,所述编码器可以是将输入序列转化成一个固定长度向量的工具。所述注意力机制层具有决定需要关注输入的哪部分及分配有限的信息处理资源给重要的部分的能力。所述归一化指数函数可以是softmax函数。所述相似度可以通过余弦相似度算法进行计算。所述预设的相似度点击率转换规则可以是相似度大小与点击率的对应规则,一般而言,相似度越大,点击率越高。
128.本发明实施例利用所述医学古文推荐模型中注意力机制层的归一化指数函数对所述用户编码向量及所述古文特征向量进行计算,得到理想古文向量,实现用户与古文之间的交互,提高了医疗古文推荐模型排序的精度,从而提高了医疗古文推荐的准确率。
129.进一步地,作为本发明一可选实施例,所述利用所述医学古文推荐模型中注意力机制层的归一化指数函数对所述用户编码向量及所述古文特征向量进行计算,得到理想古文向量,包括:
130.根据所述注意力机制层中的第一注意力参数矩阵对所述用户编码向量做线性变换,得到查询向量;
131.根据所述注意力机制层中的第二注意力参数矩阵及第三注意力参数矩阵对所述古文特征向量做线性变换,得到关键向量及数值向量;
132.将所述关键向量与查询向量的转置向量点乘,得到相似度矩阵;
133.对所述相似度矩阵进行归一化计算,得到权重矩阵;
134.将所述权重矩阵与所述数值向量点乘,得到理想古文向量。
135.本发明实施例中,所述第一注意力参数矩阵、第二注意力参数矩阵及第三注意力参数矩阵可以是所述医学古文推荐模型注意力机制层中经过多次训练调优得到的参数矩阵。
136.本发明实施例通过对所述用户编码向量及所述古文特征向量进行一系列计算,得到理想古文向量,再利用所述理想古文向量对待推荐医学古文的古文特征向量做相似度计算,因此摆脱了待推荐医学古文和用户信息之间缺乏交互的缺点,从而使得医学古文推荐结果更为准确。
137.除此之外,本发明一可选实施例中,还可以采用埋点分析的方式获取所述待推荐医学古文的用户点击率。
138.s7、根据所述用户点击率的大小顺序,输出所述待推荐医学古文。
139.本发明可选实施例中,当计算出所有待推荐医学古文的用户点击率时,还需根据所述用户点击率的大小顺序,对待推荐医学古文进行排序,并根据排序结果输出所述待推荐医学古文,从而提高了医学古文推荐的成功率。
140.本发明实施例通过古文数据、译文数据及注解数据之间的关系,对古文数据进行标签,得到所有古文数据的标签结果,从而使得医学古文推荐系统能够更好的根据用户需求推荐给用户需要的古文,从而提高医学古文推荐的准确率,除此之外,本发明将所述待推荐医学古文的标签信息融入至预设的医学古文推荐模型中,使得所述医学古文推荐模型的准确率更高,进一步提高了医学古文推荐的准确率。因此,本发明提供的一种医疗古文推荐方法,能够提高医学工作者查找相关医学类古文时,医学古文推荐的准确率,从而帮助医学工作者解决所碰到的疑难杂症,提高疾病的解决效率。
141.如图4所示,是本发明医疗古文推荐装置的功能模块图。
142.本发明所述医疗古文推荐装置100可以安装于电子设备中。根据实现的功能,所述医学古文推荐装置100可以包括古文拼接模块101、古文标签模块102及医学古文推荐模块103,本发明所述模块也可以称之为单元,是指一种能够被电子设备处理器所执行,并且能够完成固定功能的一系列计算机程序段,其存储在电子设备的存储器中。
143.在本实施例中,关于各模块/单元的功能如下:
144.所述古文拼接模块101用于接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文,利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文,将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据。
145.所述古文标签模块102用于根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签。
146.所述医学古文推荐模块103用于根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率,根据所述用户点击率的大小顺序,输出所述待推荐医学古文。
147.如图5所示,是本发明实现医疗古文推荐方法的电子设备的结构示意图。
148.所述电子设备可以包括处理器10、存储器11、通信总线12和通信接口13,还可以包括存储在所述存储器11中并可在所述处理器10上运行的计算机程序,如医疗古文推荐程序。
149.其中,所述存储器11至少包括一种类型的可读存储介质,所述可读存储介质包括
闪存、移动硬盘、多媒体卡、卡型存储器(例如:sd或dx存储器等)、磁性存储器、磁盘、光盘等。所述存储器11在一些实施例中可以是电子设备的内部存储单元,例如该电子设备的移动硬盘。所述存储器11在另一些实施例中也可以是电子设备的外部存储设备,例如电子设备上配备的插接式移动硬盘、智能存储卡(smart media card,smc)、安全数字(secure digital,sd)卡、闪存卡(flash card)等。进一步地,所述存储器11还可以既包括电子设备的内部存储单元也包括外部存储设备。所述存储器11不仅可以用于存储安装于电子设备的应用软件及各类数据,例如医疗古文推荐程序的代码等,还可以用于暂时地存储已经输出或者将要输出的数据。
150.所述处理器10在一些实施例中可以由集成电路组成,例如可以由单个封装的集成电路所组成,也可以是由多个相同功能或不同功能封装的集成电路所组成,包括一个或者多个中央处理器(central processing unit,cpu)、微处理器、数字处理芯片、图形处理器及各种控制芯片的组合等。所述处理器10是所述电子设备的控制核心(control unit),利用各种接口和线路连接整个电子设备的各个部件,通过运行或执行存储在所述存储器11内的程序或者模块(例如医疗古文推荐程序等),以及调用存储在所述存储器11内的数据,以执行电子设备的各种功能和处理数据。
151.所述通信总线12可以是外设部件互连标准(peripheral component interconnect,简称pci)总线或扩展工业标准结构(extended industry standard architecture,简称eisa)总线等。该总线可以分为地址总线、数据总线、控制总线等。所述通信总线12总线被设置为实现所述存储器11以及至少一个处理器10等之间的连接通信。为便于表示,图中仅用一条粗线表示,但并不表示仅有一根总线或一种类型的总线。
152.图5仅示出了具有部件的电子设备,本领域技术人员可以理解的是,图5示出的结构并不构成对所述电子设备的限定,可以包括比图示更少或者更多的部件,或者组合某些部件,或者不同的部件布置。
153.例如,尽管未示出,所述电子设备还可以包括给各个部件供电的电源(比如电池),优选地,电源可以通过电源管理装置与所述至少一个处理器10逻辑相连,从而通过电源管理装置实现充电管理、放电管理、以及功耗管理等功能。电源还可以包括一个或一个以上的直流或交流电源、再充电装置、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。所述电子设备还可以包括多种传感器、蓝牙模块、wi-fi模块等,在此不再赘述。
154.可选地,所述通信接口13可以包括有线接口和/或无线接口(如wi-fi接口、蓝牙接口等),通常用于在该电子设备与其他电子设备之间建立通信连接。
155.可选地,所述通信接口13还可以包括用户接口,用户接口可以是显示器(display)、输入单元(比如键盘(keyboard)),可选地,用户接口还可以是标准的有线接口、无线接口。可选地,在一些实施例中,显示器可以是led显示器、液晶显示器、触控式液晶显示器以及oled(organic light-emitting diode,有机发光二极管)触摸器等。其中,显示器也可以适当的称为显示屏或显示单元,用于显示在电子设备中处理的信息以及用于显示可视化的用户界面。
156.应该了解,所述实施例仅为说明之用,在专利申请范围上并不受此结构的限制。
157.所述电子设备中的所述存储器11存储的医疗古文推荐程序是多个计算机程序的
组合,在所述处理器10中运行时,可以实现:
158.接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,
159.分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文;
160.利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文;
161.将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据;
162.根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签;
163.根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率;
164.根据所述用户点击率的大小顺序,输出所述待推荐医学古文。
165.具体地,所述处理器10对上述计算机程序的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
166.进一步地,所述电子设备集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。所述计算机可读介质可以是非易失性的,也可以是易失性的。所述计算机可读介质可以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)。
167.本发明实施例还可以提供一种计算机可读存储介质,所述可读存储介质存储有计算机程序,所述计算机程序在被电子设备的处理器所执行时,可以实现:
168.接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,
169.分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文;
170.利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文;
171.将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据;
172.根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签;
173.根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率;
174.根据所述用户点击率的大小顺序,输出所述待推荐医学古文。
175.进一步地,所述计算机可用存储介质可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序等;存储数据区可存储根据区块链节点的使用所创建的数据等。
176.在本发明所提供的几个实施例中,应该理解到,所揭露的电子设备,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模
块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
177.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
178.另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
179.对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。
180.因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
181.本发明所指区块链是分布式数据存储、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
182.此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第二等词语用来表示名称,而并不表示任何特定的顺序。
183.最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

技术特征:
1.一种医疗古文推荐方法,其特征在于,所述方法包括:接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文;利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文;将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据;根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签;根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率;根据所述用户点击率的大小顺序,输出所述待推荐医学古文。2.如权利要求1所述的医疗古文推荐方法,其特征在于,所述根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签,包括:利用预设的语言表征模型分别提取所述古文译文拼接数据及所述古文注解拼接数据的特征数据,得到译文特征向量及注解特征向量;拼接所述译文特征向量及所述注解特征向量,得到译文注解拼接向量,并对所述译文注解拼接向量进行线性转换,得到线性特征向量;对所述线性特征向量进行归一化处理,得到标签特征向量,并根据所述标签特征向量的向量维度与预设标签的映照关系,得到所述待推荐医学古文的古文标签。3.如权利要求2所述的医疗古文推荐方法,其特征在于,所述利用预设的语言表征模型分别提取所述古文译文拼接数据及所述古文注解拼接数据的特征数据,得到译文特征向量及注解特征向量,包括:对所述古文译文拼接数据进行向量化处理,得到古文译文拼接文本向量,以及对所述古文注解拼接数据进行向量化处理,得到古文注解拼接文本向量;利用预设的语言表征模型中注意力机制模块的不同分类层参数矩阵分别对所述古文译文拼接文本向量进行线性变换,得到古文译文查询向量、古文译文关键向量及古文译文数值向量;利用所述分类层参数矩阵分别对所述古文注解拼接文本向量进行线性变换,得到古文注解查询向量、古文注解关键向量及古文注解数值向量;利用所述注意力机制模块中的归一化指数函数对所述古文译文查询向量、所述古文译文关键向量及所述古文译文数值向量进行计算,得到古文译文权重向量;利用所述归一化指数函数对所述古文注解查询向量、所述古文注解关键向量及所述古文注解数值向量进行计算,得到古文注解权重向量;利用所述语言表征模型中的解码模块分别对所述古文译文权重向量及所述古文注解权重向量进行解码,得到译文特征向量及注解特征向量。4.如权利要求3所述的医疗古文推荐方法,其特征在于,所述对所述古文译文拼接数据进行向量化处理,得到古文译文拼接文本向量:
对所述古文译文拼接数据进行文本编码,得到古文译文拼接向量;对所述古文译文拼接数据的每一个文字进行位置索引编码,得到古文译文拼接位置编码;根据所述古文译文拼接向量与所述古文译文拼接位置编码,得到古文译文拼接文本向量。5.如权利要求2所述的医疗古文推荐方法,其特征在于,所述对所述线性特征向量进行归一化处理,得到标签特征向量,包括:将所述线性特征向量与预设标签参数矩阵进行叉乘,得到目标线性特征向量;将所述目标线性特征向量与预设标签参数向量进行相加,得到目标特征向量;利用预设激活函数对所述目标特征向量进行归一化计算,得到标签特征向量。6.如权利要求1所述的医疗古文推荐方法,其特征在于,所述分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征中的提取所述用户信息的特征信息,得到用户特征,包括:对所述用户信息进行单词提取,得到信息词袋;对所述用户信息进行分句处理,得到用户信息分句;根据所述信息词袋中每个单词的先后顺序及所述用户信息分句中出现的单词,对所述用户信息分句进行编码,得到所述用户信息分词语句特征;将所述用户信息分词语句特征进行拼接,得到用户特征。7.如权利要求1所述的医疗古文推荐方法,其特征在于,所述根据所述用户信息、所述待推荐医学古文的译文特征向量、注解特征向量及标签结果,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率,包括:获取所述待推荐医学古文的译文特征向量、注解特征向量;将所述待推荐医学古文的译文特征向量、注解特征向量及标签结果进行拼接,得到古文特征向量;利用预设的医学古文推荐模型中的编码器对所述用户信息进行编码,得到用户编码向量;利用所述医学古文推荐模型中注意力机制层的归一化指数函数对所述用户编码向量及所述古文特征向量进行计算,得到理想古文向量;计算所述古文特征向量与所述理想古文向量的相似度,并根据预设的相似度点击率转换规则,将所述相似度转换为所述待推荐医学古文的用户点击率。8.一种医疗古文推荐装置,其特征在于,所述装置包括:古文拼接模块,用于接收用户输入的搜索关键词,获取所述用户在医学平台上的用户信息,分别提取所述搜索关键词及所述用户信息的特征信息,得到关键词特征及用户特征,并在预设产品库中查找与所述古文特征及所述用户特征中的用户行为序列相匹配的召回古文,利用预设的粗排算法,对所述召回古文进行粗排,得到待推荐医学古文,将所述待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据;古文标签模块,用于根据所述古文译文拼接数据及所述古文注解拼接数据,对所述待推荐医学古文打标,得到古文标签;
医学古文推荐模块,用于根据所述用户信息及所述待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算所述待推荐医学古文的用户点击率,根据所述用户点击率的大小顺序,输出所述待推荐医学古文。9.一种电子设备,其特征在于,所述电子设备包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的计算机程序指令,所述计算机程序指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行如权利要求1至7中任一项所述的医疗古文推荐方法。10.一种计算机可读存储介质,存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的医疗古文推荐方法。

技术总结
本发明涉及数字医疗领域,揭露一种医疗古文推荐方法、装置、电子设备及存储介质,可用于医疗行业中查找医学类古文,所述方法包括:接收用户输入的搜索关键词,获取用户的用户信息,并根据搜索关键词及用户信息,筛选待推荐医学古文;将待推荐医学古文分别与对应的译文数据及注解数据拼接,得到古文译文拼接数据及古文注解拼接数据;根据古文译文拼接数据及古文注解拼接数据,对待推荐医学古文打标,得到古文标签;根据用户信息及待推荐医学古文的古文标签,利用预设的医学古文推荐模型计算待推荐医学古文的用户点击率;根据用户点击率的大小顺序,输出待推荐医学古文。本发明可以提高医学工作者查找相关医学类古文时,中医古文推荐的准确率。荐的准确率。荐的准确率。


技术研发人员:侯翠琴 杜江楠 周琪妤 李剑锋
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.06.12
技术公布日:2023/8/31
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐