一种基于提示学习增强的新闻推荐方法和装置与流程

未命名 10-25 阅读:92 评论:0


1.本技术涉及序列推荐技术领域,尤其涉及一种基于提示学习增强的新闻推荐方法和装置。


背景技术:

2.面对五花八门的海量新闻信息,用户更愿意把时间花在感兴趣的领域,因此需要为用户提供个性化的新闻推荐,帮助用户快速找到感兴趣的新闻。传统的新闻推荐系统包括使用基于内容的推荐模型和协同过滤模型。这些模型既可单独使用也可以结合使用。随着序列推荐技术研究应用的不断深化,新闻推荐方法引入了预训练语言模型,它遵循常规的预训练和微调范式,使用设计好的针对新闻推荐的神经网络和损失函数,来学习用户表示。但是,由于与预训练语言模型的任务目标不一致,上述范式不能很好地利用预训练过程中嵌入的丰富的语义信息和语言知识。
3.因此,如何在新闻推荐任务上增强传统新闻推荐模型的能力,同时既能充分发挥了大语言模型的语义表现能力,又能弥补大语言模型在新闻推荐任务中的能力不足,从而有效提升了新闻推荐的准确性和用户体验感,是亟待解决的技术问题。


技术实现要素:

4.有鉴于此,本技术实施例提供了一种基于提示学习增强的新闻推荐方法、装置、电子设备及计算机可读存储介质,以解决现有技术既能充分发挥了大语言模型的语义表现能力,又能弥补大语言模型在新闻推荐任务中的能力不足的问题。
5.本技术实施例的第一方面,提供了一种基于提示学习增强的新闻推荐方法,包括:获取第一输入表征;将所述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;利用提示学习模板将所述第一输入表征转换为第二输入表征后,输入所述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;融合所述第一新闻推荐结果和所述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。
6.本技术实施例的第二方面,提供了一种基于提示学习增强的新闻推荐装置,适用于第一方面所述的基于提示学习增强的新闻推荐方法,包括:输入表征获取模块,能够获取第一输入表征;第一新闻推荐结果生成模块,能够将所述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;第二新闻推荐结果生成模块,能够利用提示学习模板将所述第一输入表征转换为第二输入表征后,输入所述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;新闻推荐结果增强模块,能够融合所述第一新闻推荐结果和所述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。
7.本技术实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现第一方面所述方法的步骤。
8.本技术实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现第一方面所述方法的步骤。
9.本技术实施例与现有技术相比存在的有益效果至少包括:本技术实施例通过获取第一输入表征,将第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;再利用提示学习模板将第一输入表征转换为第二输入表征后,输入第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;最后融合第一新闻推荐结果和第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。本技术的方案既能充分发挥了大语言模型的语义表现能力,同时又能弥补大语言模型在新闻推荐任务中的能力不足,有效提升了新闻推荐的准确性和用户体验感。
附图说明
10.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
11.图1是本技术实施例提供的基于提示学习增强的新闻推荐模型架构示意图;图2是本技术实施例提供的一种基于提示学习增强的新闻推荐方法的流程示意图之一;图3是本技术实施例提供的一种基于提示学习增强的新闻推荐方法的流程示意图之二;图4是本技术实施例提供的一种基于提示学习增强的新闻推荐方法的流程示意图之三;图5是本技术实施例提供的一种基于提示学习增强的新闻推荐方法的流程示意图之四;图6是本技术实施例提供的一种基于提示学习增强的新闻推荐装置的结构示意图之一;图7是本技术实施例提供的一种基于提示学习增强的新闻推荐装置的结构示意图之二;图8是本技术实施例提供的一种电子设备的结构示意图。
具体实施方式
12.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本技术实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本技术。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本技术的描述。
13.下面将结合附图详细说明根据本技术实施例的一种基于提示学习增强的新闻推
荐方法、装置、电子设备和存储介质。
14.如背景技术所述,新闻推荐旨在从大量候选新闻中寻找用户感兴趣的新闻文章。新闻推荐中存在两个重要的问题,即如何表示文本内容丰富的新闻文章,以及如何从用户之前的行为中建模用户对新闻的兴趣。传统的新闻推荐方法通常依靠特征工程来代表新闻文章和用户兴趣。例如,使用url和类别来表示新闻文章,使用人口统计数据、地理信息和从他们在某网站上的消费记录推断出的行为类别来表示用户。
15.近年来,一些基于深度学习的新闻推荐方法被提出,以端到端方式学习新闻文章的表示和用户兴趣。发明人检索到的有关新闻推荐方法包括:使用去噪自动编码器模型表示来自新闻内容的新闻文章,使用gru模型表示来自历史点击新闻文音的用户兴趣,通过深度学习模型学习到的新闻和用户表示很有希望用于新闻推荐。还有方法提出通过结合从知识图谱中推导出的词向量和实体向量,利用cnn网络从新闻标题中学习知识感知的新闻表示。使用多视角学习框架来表示标题、正文、类别等不同文本的新闻文章,结合注意力模型,通过选择信息丰富的文章,从用户点击的新闻文章中推断出用户的兴趣。这些工作通常开发和验证的专有数据集,这是不可公开的,使它为其他研究人员验证这些方法和发展自己的方法闲难。
16.新闻推荐与自然语言处理有着丰富的内在关联。首先,新闻是一种常见的文本形式,文本建模技术cnn和transformer可以很自然地被用来表示新闻文章。其次,从之前点击的新闻文章中学习用户兴趣表示,与从句子中学习文档表示有相似之处。第三,新闻推荐可以表述为一个特殊的文本匹配问题,即在某个新闻阅读兴趣空间中,一篇候选新闻文章与一组之前点击过的新闻文章之间的匹配。
17.新闻推荐系统通常使用的模型包括基于内容的推荐模型和协同过滤模型。这些模型可以单独使用,也可以结合使用。基于内容的推荐模型通过分析用户过去阅读过的新闻内容,来为用户推荐与其过去阅读内容相似的新闻。其实现步骤通常包括以下几个步骤:收集数据,收集用户的阅读历史数据,以及新闻文章的相关信息;数据预处理,对收集到的数据进行清洗和预处理,以便进行后续的分析和建模;特征提取,对新闻文章进行特征提取,提取出能够代表文章内容的特征,如关键词、主题等;模型训练,使用收集到的数据对推荐算法进行训练,以便为用户提供更准确的推荐结果;结果呈现,将推荐结果呈现给用户,可以通过网页、应用或其他方式进行展示。
18.发明人检索到,在使用个性化的新闻推荐方法来帮助用户发现符合他们兴趣的文章时,通常会预测用户与候选文章之间的匹配分数以反映用户对文章的偏好,已使用的语言模型技术,例如注意力机制,基于用户过去的行为来捕获用户的兴趣,并理解文章的内容。然而,如果考虑到额外的信息,这些现有的模型架构需要调整。预训练的大型语言模型由于可以更好地捕捉单词关系和理解上下文,得到了显著的发展,这些预训练的模型具有迁移学习和减少下游任务训练时间的优点。此外,发明人在对技术方案进行研究时发现,提示学习是一种新开发的技术,它通过为输出生成构建特定于任务的指导来利用预先训练的语言模型。如果利用新闻文章中的文本信息,将预训练的大语言模型和提示学习引入新闻推荐。
19.因此,在使用预训练语言模型来编码新闻表示,并遵循常规的预训练和微调范式的情况下,如何弥补预训练语言模型,例如大语言模型,在推荐任务中的能力不足,又能充
分发挥大语言模型的语义表现能力,有效提升了新闻推荐的准确性和用户体验感,是本技术实施例要解决的技术问题。
20.如图1所示,为本技术的基于提示学习增强的新闻推荐模型框架。新闻推荐模型框架主要包含2个分支:一个分支为采用传统新闻推荐模型的分支,另一个分支为基于大语言模型并引入提示学习构建的新闻推荐分支。在两个分支各自获得新闻推荐结果的基础上,还包括新闻推荐结果融合子模型,对两个分支的新闻推荐结果进行重新打分排序,得到最终的新闻推荐结果,发送给用户。此外,当用户收到新闻推荐结果后,还包括采集用户对新闻推荐结果评价反馈子模型,可以利用强化学习类算法,将用户反馈输入至模型的两个分支,进一步优化模型参数,以便得到更加准确的新闻推荐结果。
21.基于图1所示的基于提示学习增强的新闻推荐模型,如图2所示为本技术的一种基于提示学习增强的新闻推荐方法流程图,上述方法包括:s201:获取第一输入表征。
22.s202:将上述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;s203:利用提示学习模板将上述第一输入表征转换为第二输入表征后,输入上述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;s204:融合上述第一新闻推荐结果和上述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。
23.在一些实施例中,上述第一输入表征包括用户特征、新闻特征和上下文特征;和/或,上述第一新闻推荐分支包括利用deepfm模型进行构建,用于将上述第一输入表征经过特征提取后,输入至上述deepfm模型,获得上述第一新闻推荐结果。
24.具体地,新闻推荐目的是将合适的新闻推荐给感兴趣的用户。因此实现要对用户,新闻,推荐的上下文场景做表征,将其转为可供模型使用的不同特征:离散特征,连续特征,query特征等。以用户为例:用户的年龄,性别,收入,喜欢新闻的偏好等;新闻特征,文章的标题,长度,类别,新闻所属领域等。将上述特征进行向量编码后,输入至deepfm,即dnn + fm,经过dnn的深度交叉和fm的显示二阶交叉,模型输出用户最有可能点击的新闻列表。
25.在一些实施例中,上述提示学习模板包括提示模板和答案模板。
26.在一些实施例中,利用提示学习模板将上述第一输入表征转换为第二输入表征,如图3所示,包括:s311:依据用户历史记录和新闻交互日志,构造第一提示数据集;s312:基于上述第一提示数据集的提示数据,将当前训练任务的上述提示模板和上述答案模板一对一组成一对,获得作为上述第二新闻推荐分支的输入的上述第二输入表征。
27.具体地,第一提示数据集由新闻推荐系统中保存的用户历史与新闻交互日志所构成。对于一条提示数据而言,需要将用户历史与新闻交互日志转化为一个自然句子,并且结合用户特征、新闻特征以及上下文特征,形成提示数据。
28.这其中,用户特征、新闻特征以及上下文特征等三个维度的特征,来自于第一新闻推荐分支,也即所谓传统推荐分支,该部分特征数据是第一新闻推荐分支和第二新闻推荐分支之间的共享数据。
29.对于一条提示数据在构成自然语言时,需要使用到自然语言处理的模板构造机
制。以本技术实施例的新闻推荐系统为背景,由于该自然语句模板是基于提示学习的,因此,为了更好地达到提示学习的效果,模板分为提示模板和答案模板。
30.其中,上述提示模板基于保存的用户历史与新闻交互日志,包含了用户特征、新闻特征和上下文特征,例如:《用户》《性别》《年龄》,《上下文》点击了《新闻标题1》《新闻标题2》, 这些新闻都是《新闻特征1》《新闻特征2》
……

31.上述答案模板用于基于提示模板采用了自然语言处理中的完形填空方式,例如:《具体时间点》该用户还会看《mask》。
32.基于上述模板的定义,一个用于训练的提示数据如下:张三,男,41岁,在某品牌手机某app上,周六晚上,点击了题目为“xxx”“yyy”,这些新闻都是aa类、bb类cc类的题材,明天晚上,张三还会看
……

33.需要说明的是,提示学习模板的构造比较多样化,这个部分是可以参考nlp的任务结合新闻推荐的背景进行扩展。例如可以设计一系列提示西也许模板,包括离散模板、连续模板和混合模板等。引入提示学习方法实质是将新闻推荐问题转化为自然语言处理中的完形填空,为新闻推荐结合大语言模型提供了一个新思路,此处不再赘述。
34.在一些实施例中,上述第二新闻推荐分支包括利用大语言模型进行构建,用于将上述第二输入表征输入至上述大语言模型,获得上述第二新闻推荐结果。
35.具体地,大语言模型如bart、gpt、opt或palm等模型,其结构要求为语言生成模型即可,均可用来执行本实施例的代码生成与缺陷修复方法。同时,在选择使用参数规模时,为了确保代码缺陷评估的准确性,所选模型应具有与代码生成与缺陷修复效果需求匹配的参数规模,例如,模型总参数量至少10亿以上。
36.在一些实施例中,在上述第一新闻推荐分支与上述第二新闻推荐分支之间,共享参数和/或数据特征;其中,上述参数包括上述第一新闻推荐分支的用户向量和上述第二新闻推荐分支的向量语义,上述数据特征包括连续特征、离散特征和/或query特征。
37.具体地,除了提升学习之外,我们对大模型的部分参数进行微调,使得其能够在当前的新闻推荐背景中更快的收敛,其中,一些核心参数来自于传统推荐模型deepfm中的参数。因为这部分模型训练收敛速度更快。
38.另外,通过参数共享,也可以将传统推荐模型中的推荐向量语义扩展到大模型中,提高大模型在推荐中的准确性。
39.需要说明的是,本发明将传统推荐模型和基于提升学习的大模型结合起来,并且在数据特征和模型参数两个方面进行了共享,有效利用了传统推荐模型在推荐方面的稳定性优势,以及大模型在自然语言处理中的表现能力,提升新闻推荐的准确性和用户体验。
40.在一些实施例中,上述第一新闻推荐结果、第二新闻推荐结果和最终新闻推荐结果均包括推荐列表和对应新闻的推荐分数。
41.在一些实施例中,融合上述第一新闻推荐结果和上述第二新闻推荐结果,获得最终新闻推荐结果并发送至用户,如图4所示,包括:s411:依据上述第一新闻推荐结果的上述推荐分数和上述第二新闻推荐结果的上述推荐分数,加权求和确定上述最终新闻推荐结果的上述推荐分数;s412:依据上述最终新闻推荐结果的上述推荐分数,获得上述最终新闻推荐结果
的上述推荐列表,并发送至用户。
42.具体地,将第一新闻推荐分支的推荐结果和第二新闻推荐分支的推荐结果按照加权融合,最后推荐给用户的融合公式如下:。其中,表示第一新闻推荐分支得到的第一新闻推荐结果中的新闻得分,为该得分的权重;表示第二新闻推荐分支得到的第二新闻推荐结果中的新闻得分,为该得分的权重;并且满足。
43.需要说明的是,由于第一新闻推荐分支,例如deepfm模型的最终输出是一个概率值,代表了用户点击物品可能性,因此其分数越高表示用户点击的兴趣越浓厚。对于第二新闻推荐分支,基于提示学习设计模板,将推荐任务转为句子,送到模型中进行句子级别的语义理解,其推荐结果的分数可以体现于句子表达中,也可以以其他形式展示。
44.此外,为了使得推荐分数能够融合两个分支的分数,需要首先针对每个推荐分支进行推荐分数的归一化,然后将归一化后的推荐结果进行融合。
45.在使用本技术实施例的新闻推荐模型的初期,可以将权重值可以设置高一些,以保证推荐的稳定性,待大语言模型经过一定量数据训练对场景更熟悉后,慢慢调高的权重值。
46.在一些实施例中,如图5所示,上述方法还包括:s205:获取用户对最终新闻推荐结果的反馈数据,基于强化学习类算法,对上述第一新闻推荐分支和上述第二新闻推荐分支的参数进行更新。
47.具体地,推荐结果实时展现给用户后,用户会做出喜欢或者不喜欢的反馈,通过实时收集这些动态反馈,利用强化学习的思路,不断的优化调整两个推荐分支的模型,以便在此闭环中能够确保推荐长期的生态和用户的良好体验。
48.需要说明的是,使用强化学习类算法就是利用了用户的正负反馈,作为实时样本或者新提示数据,对两个分支的模型参数进行更新,也即能对新闻推荐结果和用户需求匹配度进行实时反馈,以便对该新闻推荐模型特别是对融合分数权重值进行优化调整,达到实时抓取用户兴趣以提升推荐结果准确度的效果。
49.本技术实施例通过获取第一输入表征,将第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;再利用提示学习模板将第一输入表征转换为第二输入表征后,输入第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;最后融合第一新闻推荐结果和第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。本技术的方案既能充分发挥了大语言模型的语义表现能力,同时又能弥补大语言模型在新闻推荐任务中的能力不足,有效提升了新闻推荐的准确性和用户体验感。
50.上述所有可选技术方案,可以采用任意结合形成本技术的可选实施例,在此不再一一赘述。
51.下述为本技术装置实施例,可以用于执行本技术方法实施例。对于本技术装置实施例中未披露的细节,请参照本技术方法实施例。
52.图6是本技术实施例提供的一种基于提示学习增强的新闻推荐装置的示意图。如图6所示,适用于上述基于提示学习增强的新闻推荐方法,上述装置包括:
输入表征获取模块601,能够获取第一输入表征。
53.第一新闻推荐结果生成模块602,能够将上述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果。
54.第二新闻推荐结果生成模块603,能够利用提示学习模板将上述第一输入表征转换为第二输入表征后,输入上述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果。
55.新闻推荐结果增强模块604,能够融合上述第一新闻推荐结果和上述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。
56.图7是本技术实施例提供的一种基于提示学习增强的新闻推荐装置另一种实现方式示意图。如图7所示,适用于上述基于提示学习增强的新闻推荐方法,上述装置还包括:反馈更新模块605,能够获取用户对最终新闻推荐结果的反馈数据,基于强化学习类算法,对上述第一新闻推荐分支和上述第二新闻推荐分支的参数进行更新。
57.应理解,本说明书实施例的一种基于提示学习增强的新闻推荐装置还可执行图1至图5中基于提示学习增强的新闻推荐装置执行的方法,并实现基于提示学习增强的新闻推荐装置在图1至图5所示实例的功能,在此不再赘述。同时,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本技术实施例的实施过程构成任何限定。
58.图8是本技术实施例提供的电子设备8的示意图。如图8所示,该实施例的电子设备8包括:处理器801、存储器802以及存储在该存储器802中并且可在处理器801上运行的计算机程序803。处理器801执行计算机程序803时实现上述各个方法实施例中的步骤。或者,处理器801执行计算机程序803时实现上述各装置实施例中各模块/单元的功能。
59.电子设备8可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备8可以包括但不仅限于处理器801和存储器802。本领域技术人员可以理解,图8仅仅是电子设备8的示例,并不构成对电子设备8的限定,可以包括比图示更多或更少的部件,或者不同的部件。
60.存储器802可以是电子设备8的内部存储单元,例如,电子设备8的硬盘或内存。存储器802也可以是电子设备8的外部存储设备,例如,电子设备8上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。存储器802还可以既包括电子设备8的内部存储单元也包括外部存储设备。存储器802用于存储计算机程序以及电子设备所需的其它程序和数据。
61.处理器801可以是中央处理单元(central processing unit,cpu),也可以是其它通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。处理器801从非易失性存储器中读取对应的计算机程序到内存中然后运行,在逻辑层面上形成共享资源访问控制装置。处理器,执行存储器所存放的程序,并具体用于执行以下操作:获取第一输入表征;将上述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;
利用提示学习模板将上述第一输入表征转换为第二输入表征后,输入上述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;融合上述第一新闻推荐结果和上述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。
62.上述如本说明书图1至图5所示实施例揭示的基于提示学习增强的新闻推荐方法可以应用于处理器801中,或者由处理器801实现。处理器801可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以实现或者执行本说明书实施例中公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本说明书实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
63.当然,除了软件实现方式之外,本说明书实施例的电子设备并不排除其他实现方式,比如逻辑器件抑或软硬件结合的方式等等,也就是说以下处理流程的执行主体并不限定于各个逻辑单元,也可以是硬件或逻辑器件。
64.所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
65.集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本技术实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
66.本说明书实施例还提出了一种计算机可读存储介质,该计算机可读存储介质存储一个或多个程序,该一个或多个程序包括指令,该指令当被包括多个应用程序的便携式电子设备执行时,能够使该便携式电子设备执行图1至图5所示实施例的基于提示学习增强的新闻推荐方法,并具体用于执行以下方法:获取第一输入表征;
将上述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;利用提示学习模板将上述第一输入表征转换为第二输入表征后,输入上述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;融合上述第一新闻推荐结果和上述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。
67.总之,以上该仅为本说明书的较佳实施例而已,并非用于限定本说明书的保护范围。凡在本说明书的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本说明书的保护范围之内。
68.上述实施例阐明的系统、装置、模块或单元,具体可以由计算机芯片或实体实现,或者由具有某种功能的产品来实现。一种典型的实现设备为计算机。具体的,计算机例如可以为个人计算机、膝上型计算机、蜂窝电话、相机电话、智能电话、个人数字助理、媒体播放器、导航设备、电子邮件设备、游戏控制台、平板计算机、可穿戴设备或者这些设备中的任何设备的组合。
69.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
70.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、商品或者设备中还存在另外的相同要素。
71.本说明书中的各个实施例均采用递进的方式描述,各个实施例之间相同相似的部分互相参见即可,每个实施例重点说明的都是与其他实施例的不同之处。尤其,对于系统实施例而言,由于其基本相似于方法实施例,所以描述的比较简单,相关之处参见方法实施例的部分说明即可。
72.以上实施例仅用以说明本技术的技术方案,而非对其限制;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的精神和范围,均应包含在本技术的保护范围之内。

技术特征:
1.一种基于提示学习增强的新闻推荐方法,其特征在于,包括:获取第一输入表征;将所述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;利用提示学习模板将所述第一输入表征转换为第二输入表征后,输入所述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;融合所述第一新闻推荐结果和所述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。2.根据权利要求1所述的方法,其特征在于,所述第一输入表征包括用户特征、新闻特征和上下文特征;和/或,所述第一新闻推荐分支包括利用deepfm模型进行构建,用于将所述第一输入表征经过特征提取后,输入至所述deepfm模型,获得所述第一新闻推荐结果。3.根据权利要求2所述的方法,其特征在于,所述提示学习模板包括提示模板和答案模板;以及,利用提示学习模板将所述第一输入表征转换为第二输入表征,包括:依据用户历史记录和新闻交互日志,构造第一提示数据集;基于所述第一提示数据集的提示数据,将当前训练任务的所述提示模板和所述答案模板一对一组成一对,获得作为所述第二新闻推荐分支的输入的所述第二输入表征。4.根据权利要求3所述的方法,其特征在于,所述第二新闻推荐分支包括利用大语言模型进行构建,用于将所述第二输入表征输入至所述大语言模型,获得所述第二新闻推荐结果。5.根据权利要求4所述的方法,其特征在于,在所述第一新闻推荐分支与所述第二新闻推荐分支之间,共享参数和/或数据特征;其中,所述参数包括所述第一新闻推荐分支的用户向量和所述第二新闻推荐分支的向量语义,所述数据特征包括连续特征、离散特征和/或query特征。6.根据权利要求1所述的方法,其特征在于,所述第一新闻推荐结果、第二新闻推荐结果和最终新闻推荐结果均包括推荐列表和对应新闻的推荐分数;以及,融合所述第一新闻推荐结果和所述第二新闻推荐结果,获得最终新闻推荐结果并发送至用户,包括:依据所述第一新闻推荐结果的所述推荐分数和所述第二新闻推荐结果的所述推荐分数,加权求和确定所述最终新闻推荐结果的所述推荐分数;依据所述最终新闻推荐结果的所述推荐分数,获得所述最终新闻推荐结果的所述推荐列表,并发送至用户。7.据权利要求1所述的方法,其特征在于,还包括:获取用户对最终新闻推荐结果的反馈数据,基于强化学习类算法,对所述第一新闻推荐分支和所述第二新闻推荐分支的参数进行更新。8.一种基于提示学习增强的新闻推荐装置,其特征在于,适用于权利要求1至7任一项所述的基于提示学习增强的新闻推荐方法,所述装置包括:输入表征获取模块,能够获取第一输入表征;第一新闻推荐结果生成模块,能够将所述第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;第二新闻推荐结果生成模块,能够利用提示学习模板将所述第一输入表征转换为第二输入表征后,输入所述第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;
新闻推荐结果增强模块,能够融合所述第一新闻推荐结果和所述第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器在执行所述计算机程序时,实现如权利要求1至7任一项所述方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述方法的步骤。

技术总结
本申请涉及序列推荐技术领域,提供了一种基于提示学习增强的新闻推荐方法和装置。该方法包括:获取第一输入表征;将第一输入表征输入至第一新闻推荐分支,获得第一新闻推荐结果;利用提示学习模板将第一输入表征转换为第二输入表征后,输入第二输入表征至第二新闻推荐分支,获得第二新闻推荐结果;融合第一新闻推荐结果和第二新闻推荐结果,获得最终新闻推荐结果,并发送至用户。本申请实施例能充分发挥了大语言模型的语义表现能力,也能弥补大语言模型在新闻推荐任务中的能力不足,有效提升了新闻推荐的准确性和用户体验感。了新闻推荐的准确性和用户体验感。了新闻推荐的准确性和用户体验感。


技术研发人员:齐盛 董辉
受保护的技术使用者:深圳须弥云图空间科技有限公司
技术研发日:2023.09.12
技术公布日:2023/10/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐