内容发送方法、装置、电子设备和存储介质与流程
未命名
09-24
阅读:58
评论:0
1.本技术涉及计算机技术领域,具体涉及一种内容发送方法、装置、电子设备和存储介质。
背景技术:
2.随着计算机技术的发展,以电子设备为载体的应用也得到了快速的发展,并带来了海量的内容。如何精确地从海量的内容中选取对象感兴趣的内容,并发送给对象,成为许多应用的关注重点。发明人通过对现有技术的实践发现,现有技术中,存在从海量内容中选取对象感兴趣的内容的精确度较低的问题。
技术实现要素:
3.本技术实施例提供一种内容发送方法、装置、电子设备和存储介质,可以提高从海量内容中筛选出目标待发送内容并发送给对象的精确度。
4.本技术实施例提供一种内容发送方法,包括:
5.获取对象在至少两个数据类型上的对象数据;
6.对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;
7.基于每个数据类型对应的对象特征,生成所述对象对应的属性特征;
8.对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息;
9.基于所述至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将所述目标待发送内容发送给所述对象。
10.相应的,本技术实施例提供一种内容发送装置,包括:
11.获取单元,用于获取对象在至少两个数据类型上的对象数据;
12.特征编码单元,用于对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;
13.生成单元,用于基于每个数据类型对应的对象特征,生成所述对象对应的属性特征;
14.内容映射单元,用于对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息;
15.筛选单元,用于基于所述至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将所述目标待发送内容发送给所述对象。
16.在一实施例中,所述内容映射单元,可以包括:
17.第一获取子单元,用于获取全局属性嵌入字典,所述全局属性嵌入字典包括多个参考内容属性信息,其中,不同的参考内容属性信息对应不同的属性维度;
18.第一计算子单元,用于计算所述多个参考内容属性信息和所述属性特征之间的相
似度信息;
19.第一筛选子单元,用于根据所述相似度信息,从所述多个参考内容属性信息中筛选出至少两个属性维度上的内容属性信息。
20.在一实施例中,所述内容映射单元,还可以包括:
21.第二获取子单元,用于获取初始属性嵌入字典和对象样本数据,所述初始属性嵌入字典包括多个初始内容属性信息;
22.第二筛选子单元,用于基于所述对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;
23.第二计算子单元,用于计算所述目标待发送样本内容和预设样本标签之间的损失信息;
24.第一更新子单元,用于基于所述损失信息更新所述初始属性嵌入字典中的初始内容属性信息,得到全局属性嵌入字典。
25.在一实施例中,所述内容映射单元,可以包括:
26.信息提取子单元,用于基于自注意力机制对所述属性特征进行至少两个属性维度上的信息提取,得到所述属性特征对应的多维自注意力信息;
27.转换子单元,用于利用所述多维自注意力信息将所述属性特征转换为所述对象在至少两个属性维度上的内容属性信息。
28.在一实施例中,所述信息提取子单元,可以包括:
29.特征定位模块,用于基于所述自注意力机制,对所述属性特征进行特征定位,得到定位信息;
30.第一映射模块,用于基于所述自注意力机制,将所述定位信息映射到多维内容属性特征空间中,得到映射结果;
31.逻辑回归模块,用于基于所述自注意力机制,对所述映射结果进行逻辑回归处理,得到所述多维自注意力信息。
32.在一实施例中,所述内容映射单元,还可以包括:
33.第三获取子单元,用于获取初始自注意力机制和对象样本数据;
34.第三筛选子单元,用于基于所述对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;
35.第三计算子单元,用于计算所述目标待发送样本内容和所述对象样本数据之间的契合度信息;
36.调整子单元,用于基于所述契合度信息对所述初始自注意力机制进行调整,得到自注意力机制。
37.在一实施例中,所述特征编码单元,可以包括:
38.识别子单元,用于对所述至少两个数据类型上的对象数据进行识别,得到每个数据类型上对象数据对应的特征编码方式;
39.特征编码子单元,用于利用每个数据类型上对象数据对应的特征编码方式对所述对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。
40.在一实施例中,所述特征编码子单元,可以包括:
41.向量转换模块,用于对所述多个不同数据维度上的数据进行向量转换处理,得到
每个数据维度上数据对应的表征向量;
42.第一融合模块,用于将每个数据维度上数据对应的表征向量进行融合处理,得到目标表征向量;
43.全连接模块,用于对所述目标表征向量进行全连接处理,得到全连接特征;
44.激活模块,用于对所述全连接特征进行激活处理,得到所述对象特征。
45.在一实施例中,所述特征编码子单元,可以包括:
46.识别模块,用于对所述数据类型上的对象数据进行识别,得到所述对象数据的数据有效比例;
47.数据编码模块,用于根据所述数据有效比例,对所述对象数据进行数据编码,得到所述对象数据对应的数据特征;
48.位置编码模块,用于对所述对象数据进行位置编码,得到所述对象数据对应的位置特征;
49.第二融合模块,用于将所述数据特征和所述位置特征进行融合处理,得到所述对象特征。
50.在一实施例中,所述数据编码模块,可以包括:
51.截取子模块,用于根据所述数据有效比例,对所述对象数据进行截取处理,得到至少一次截取后对象数据;
52.向量映射子模块,用于将所述截取后对象数据进行向量映射处理,得到每个截取后对象数据对应的表示向量;
53.向量融合子模块,用于将每个截取后对象数据对应的表示向量进行向量融合处理,得到所述数据特征。
54.在一实施例中,所述生成单元,可以包括:
55.注意力融合子单元,用于将每个数据类型对应的对象特征进行注意力融合,得到融合后特征;
56.分布拟合子单元,用于将所述融合后特征进行概率分布拟合处理,得到所述融合后特征对应的概率分布;
57.特征映射子单元,用于将所述概率分布映射到所述对象对应的属性特征。
58.本技术实施例还提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述一方面的各种可选方式中提供的方法。
59.相应的,本技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质存储有指令,所述指令被处理器执行时实现本技术实施例任一提供的搜索内容分享方法。
60.本技术实施例提供了一种内容发送方法、装置、电子设备和存储介质,可以获取对象在至少两个数据类型上的对象数据;对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;基于每个数据类型对应的对象特征,生成对象对应的属性特征;对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息;基于至少两个属性维度上的内容属性信息,从待发送内容
中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象,可以提高从海量内容中筛选出目标待发送内容并发送给对象的精确度。
附图说明
61.为了更清楚地说明本技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
62.图1a是本技术实施例提供的内容发送方法的场景示意图;
63.图1b是本技术实施例提供的内容发送方法的流程图;
64.图2a是本技术实施例提供的内容发送方法的另一流程图;
65.图2b是本技术实施例提供的内容发送方法的另一流程图;
66.图2c是本技术实施例提供的内容发送方法的另一流程图;
67.图3是本技术实施例提供的内容发送装置的结构示意图;
68.图4是本技术实施例提供的电子设备的结构示意图。
具体实施方式
69.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
70.本技术实施例提供一种内容发送方法、装置、电子设备和存储介质。该内容发送装置具体可以集成在电子设备中,该电子设备可以是终端或服务器等设备。
71.可以理解的是,本实施例的内容发送方法可以是在终端上执行的,也可以是在服务器上执行,还可以由终端和服务器共同执行的。以上举例不应理解为对本技术的限制。
72.如图1a所示,以终端和服务器共同执行内容发送方法为例。本技术实施例提供的内容发送系统包括终端10和服务器11等;终端10与服务器11之间通过网络连接,比如,通过有线或无线网络连接等,其中,内容发送装置可以集成在服务器中。
73.其中,服务器11,可以用于:获取对象在至少两个数据类型上的对象数据;对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;基于每个数据类型对应的对象特征,生成对象对应的属性特征;对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息;基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。
74.其中,服务器11可以是单台服务器,也可以是由多个服务器组成的服务器集群或云服务器。例如,服务器可以为多个异构系统之间的互通服务器或者后台服务器,还可以是独立的物理服务器,也可以是多个物理服务器构成的服务器集群或者分布式系统,还可以是提供云服务、云数据库、云计算、云函数、云存储、网络服务、云通信、中间件服务、域名服务、安全服务、以及大数据和人工智能平台等基础云计算服务的云服务器等等。如本技术所
公开的特征提取方法或装置,其中多个服务器可组成为一区块链,而服务器为区块链上的节点。
75.其中,终端10可以接收服务器11发送的目标待发送内容,并向对象展示目标待发送内容,具体可以在相应的页面上展示该目标待发送内容。其中,终端10可以包括手机、智能电视、平板电脑、笔记本电脑、或个人计算机(pc,personal computer)等。终端10上还可以设置客户端,该客户端可以是应用程序客户端或者浏览器客户端等等。
76.上述服务器11确定目标待发送内容的步骤,也可以由终端10执行。
77.本技术实施例提供的内容发送方法涉及人工智能领域中的机器学习。本技术实施例可以提高内容发送的精确度。
78.其中,人工智能(ai,artificial intelligence)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个综合技术,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式做出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能技术是一门综合学科,涉及领域广泛,既有硬件层面的技术也有软件层面的技术。其中,人工智能软件技术主要包括计算机视觉技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等方向。
79.其中,机器学习(machine learning,ml)是一门多领域交叉学科,涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多门学科。专门研究计算机怎样模拟或实现人类的学习行为,以获取新的知识或技能,重新组织已有的知识结构使之不断改善自身的性能。机器学习是人工智能的核心,是使计算机具有智能的根本途径,其应用遍及人工智能的各个领域。机器学习和深度学习通常包括人工神经网络、置信网络、强化学习、迁移学习、归纳学习、式教学习等技术。
80.以下分别进行详细说明。需说明的是,以下实施例的描述顺序不作为对实施例优选顺序的限定。
81.本实施例将从内容发送装置的角度进行描述,该内容发送装置具体可以集成在电子设备中,该电子设备可以是服务器或终端等设备。
82.本技术实施例的内容发送方法可以应用于各种推荐场景中。例如,某网络平台需要向用户推荐包含多类型对象的数据包,可以通过本实施例提供的内容发送方法,可快速地确定待推荐的目标数据包,且本实施例提供的内容发送方法在内容发送上的准确率较高。
83.如图1b所示,该内容发送方法的具体流程可以如下:
84.101、获取对象在至少两个数据类型上的对象数据。
85.其中,对象数据可以包括能够说明对象的特点或特征的数据。例如,该对象数据可以是对象在应用上产生的数据,通过该对象数据,可以使得应用可以对对象的特点和爱好等有一个感知,从而使得可以基于对象数据从待发送内容中筛选出目标待发送内容。
86.其中,应用包括完成某项或多项特定功能的计算机程序,它运行在交互模式,可以和应用程序的使用对象进行交互,具有可视的显示界面。
87.例如,应用可以包括各种终端上的应用软件。例如,应用程序可以包括各种手机软
件(application,app)、平板电脑应用软件、笔记本电脑上的应用软件、个人计算机(pc,personal computer)上的应用软件,等等。
88.例如,应用程序可以包括社交软件、浏览器、视频播放软件、游戏软件等等。
89.又例如,应用还可以包括小程序。其中,小程序(mini program)是一种不需要下载安装即可使用的应用程序。为了向对象提供更多样化的业务服务,开发者可为终端的应用(例如即时通信应用、购物应用、邮件应用等)开发相应的小程序,该小程序可作为子应用被嵌入至终端的应用中,通过运行应用内的子应用(即对应的小程序)能够为对象提供相应的业务服务。
90.譬如,当应用是社交软件时,该对象数据可以是对象对该社交软件进行操作时的操作数据。又例如,该对象数据可以是对对象进行说明的数据。例如,该对象可以包括对象在应用中的对象标识(identity document,id)、使用应用的时间和性别,等等。
91.在一实施例中,由于对象可能在应用上生成各种各样的对象数据,因此,可以根据对象在应用上生成的各种各样数据为对象从待发送内容中筛选出目标待发送内容。因此,可以获取对象在至少两个数据类型上的对象数据。
92.例如,对象在至少两个数据类型上的对象数据可以包括对象操作数据和对象说明数据,等等。
93.其中,对象操作数据可以包括对象对应用进行操作时产生的数据。例如,对象在应用上触发了一个功能,可以产生对象操作数据。又例如,对象在应用上浏览了一些资讯,也可以产生对象操作数据,等等。
94.其中,对象说明数据可以包括对对象进行说明的数据。例如,对象说明数据可以包括对象在应用中的对象标识(identity document,id)、使用应用的时间、性别、对象的长期特征或对象的长期特征,等等。
95.其中,对象的长期特征可以包括对象在较长的时间关注的内容。譬如,对象的长期特征可以包括对象在1个月内关注的内容。例如,该长期特征可以包括长期一级类目、长期二级类目和长期标签等等。
96.其中,对象的短期特征可以包括对象在较短的时间内关注的内容。譬如,对象的短期特征可以包括对象在1天内关注的内容。例如,该短期特征可以包括短期一级类目、短期二级类目和短期标签,等等。
97.其中,类目可以包括对应用中内容的分类。例如,当应用是购物应用时,类目可以包括男装、女装、鞋子和护肤,等等。
98.其中,一级类目可以包括对一个范围的总称。二级类目则可以是对一级类目的细分。例如,当一级类目是食品时,二级类目可以包括水果、饮料和零食,等等。
99.在一实施例中,有多种方法可以获取对象在至少两个数据类型上的对象数据。
100.例如,可以利用埋点的方式获取对象在应用中生成的历史数据,并将该历史数据作为样本数据。例如,可以在开发应用的过程中,在应用的多个功能中设置埋点,每当对象使用应用中的该功能时,便会采集对象生成的数据。
101.又例如,可以利用无埋点的方式获取对象在应用中生成的历史数据,并将该历史数据作为样本数据。
102.通过获取对象在至少两个数据类型上的对象数据,可以基于更多的数据从待发送
内容中筛选出目标待发送内容,从而提高筛选出目标待发送内容的准确度。
103.其中,对象数据可以有多种表现形式。例如,该对象数据可以是一个多维向量。譬如,该对象数据可以由矩阵表示,该矩阵的矩阵值可以表示在某个时刻中对象产生的对象操作数据。其中,若对象在矩阵中相应的时刻没有产生数据,则该相应的矩阵值可以为0。若对象在相应的时刻产生了数据,则该相应的矩阵值便可以是产生的数据。
104.在一实施例中,为了提高处理的效率,还可以获取多个对象在至少两个数据类型上的对象数据。例如,可以获取小明、小红和小绿在至少两个数据类型上的对象数据。
105.在一实施例中,本技术实施例可以基于对象在至少两个数据类型上的对象数据,从待发送内容中筛选出至少两个目标待发送内容。
106.其中,待发送内容可以包括应用中可以推送给对象的内容。例如,该待发送内容可以由应用的性质决定。例如,当该应用是视频播放应用时,该待发送内容可以是视频。又例如,当该应用是资讯应用时,该待发送内容可以是文章。又例如,当该应用是音乐应用时,该待发送内容可以是音乐。
107.其中,该目标待发送内容可以是推荐给对象的内容。例如,当该目标待发送内容是视频时,可以将该视频展示给对象。
108.其中,需要说明的是:在本技术的具体实施方式中,涉及相关的敏感数据,当本技术以上实施例运用到具体产品或技术中时,需要获得对象许可或者同意,且相关数据的收集、使用和处理需要遵守相关国家和地区的相关法律法规和标准。
109.102、对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。
110.在一实施例中,由于对象数据可以有多种表现形式。例如,对象数据可能是文字、字符串或图片,等等。因此,为了提高基于对象数据筛选目标待发送内容的效率,可以对对象数据进行特征编码处理,得到对象数据对应的对象特征。通过对对象数据进行特征编码处理,可以将对象数据映射到数字空间中,从而提高后续处理的效率。
111.因此,对对象进行特征编码可以指将对象数据映射到数字空间中,对象特征可以是对象数据的一种数字表示。例如,当前数据类型的对象数据可以为[[母婴用品]、[“奶粉”、“纸尿裤”]],其对应的对象特征可以为[[001]、[101011]]。
[0112]
在一实施例中,在获取到对象数据之后,可以对对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。
[0113]
其中,由于有至少两个数据类型上的对象数据,每个数据类型的对象数据对应的特征编码方式可能会不同,因此,在对对象数据进行特征编码时,可以确定每个数据类型的对象数据对应的特征编码方式。然后,利用相应的特征编码方式对对象数据进行编码。具体的,步骤“对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征”,可以包括:
[0114]
对至少两个数据类型上的对象数据进行识别,得到每个数据类型上对象数据对应的特征编码方式;
[0115]
利用每个数据类型上对象数据对应的特征编码方式对对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。
[0116]
例如,至少两个数据类型上的对象数据可以包括对象操作数据和对象说明数据。
其中,对象操作数据对应第一特征编码方式,对象说明数据对应第二特征编码方式。其中,第一特征编码方式和第二特征编码方式可以是同一种特征编码方式,也可以是不同的特征编码方式。
[0117]
其中,有多种方式对至少两个数据类型上的对象数据进行识别,得到每个数据类型上对象数据对应的特征编码方式。
[0118]
例如,开发人员可以事先设置好每个数据类型的对象数据对应的特征编码方式,并将该数据类型的对象数据和该特征编码方式进行关联。例如,可以将数据类型的对象数据和其对应的特征编码方式添加上相同的标识。因此,内容发送装置可以获取对象数据对应的标识,并通过该标识确定当前数据类型的对象数据对应的特征编码方式。
[0119]
又例如,内容发送装置可以对每个数据类型的对象数据进行遍历,得到每个数据类型的对象数据对应的数据特点。然后根据数据特点确定每个数据类型的对象数据对应的特征编码方式。
[0120]
在一实施例中,在得到每个数据类型上对象数据对应的特征编码方式之后,可以利用每个数据类型上对象数据对应的特征编码方式对对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。
[0121]
在一实施例中,当当前数据类型的对象数据是对象操作数据时,对象操作数据的多样性可能会比较高。例如,不同对象的对象操作数据可能会有较大的差异。例如,有的对象总是使用某款应用,则对象在该款应用上的对象操作数据会比较多。而有的对象在该款应用上的对象操作数据可能会比较少。因此,在对对象操作数据进行特征编码时,可以对对象操作数据进行数据编码和位置编码,从而可以从不同的角度对对象操作数据进行特征编码,提高对对象操作数据进行特征编码处理的准确度。
[0122]
具体的,步骤“利用每个数据类型上对象数据对应的特征编码方式对对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征”,可以包括:
[0123]
对数据类型上的对象数据进行识别,得到对象数据的数据有效比例;
[0124]
根据数据有效比例,对对象数据进行数据编码,得到对象数据对应的数据特征;
[0125]
对对象数据进行位置编码,得到对象数据对应的位置特征;
[0126]
将数据特征和位置特征进行融合处理,得到对象特征。
[0127]
在一实施例中,对于对象操作数据,当对象和应用的互动比较少时,每条对象操作数据生成时间的间隔可能会比较大,那么最近一段时间内的对象操作数据则会比较重要。而当对象和应用的互动比较多时,最近一段时间内的对象操作数据可能相对会没那么重要,因为对象可能会在很短时间内浏览大量不同类型的内容。因此,可以对数据类型上的对象数据进行识别,得到对象数据的数据有效比例。
[0128]
其中,数据有效比例可以说明对象和应用的互动频率。当数据有效比例比较高时,可以说明对象和应用的互动频率比较高。而当数据有效比例比较低时,可以说明对象和应用的互动频率比较低。
[0129]
其中,有多种方式可以对数据类型上的对象数据进行识别,得到对象数据的数据有效比例。
[0130]
例如,可以对对象操作数据进行遍历,得到对象操作数据的数据长度,以及有效数据的数据长度。然后,将有效数据的数据长度和对象操作数据的数据长度进行相除,得到数
据有效比例。其中,有效数据可以指对象操作数据中非零的值。
[0131]
又例如,可以计算对象操作数据中每条数据产生的平均时间差,然后将该时间差转换为数据有效比例。例如,可以求平均时间差的倒数,从而得到数据有效比例,等等。
[0132]
在一实施例中,在得到数据有效比例之后,可以根据数据有效比例,对对象数据进行数据编码,得到对象数据对应的数据特征。具体的,步骤“根据数据有效比例,对对象数据进行数据编码,得到对象数据对应的数据特征”,可以包括:
[0133]
根据数据有效比例,对对象数据进行截取处理,得到至少一次截取后对象数据;
[0134]
将截取后对象数据进行向量映射处理,得到每个截取后对象数据对应的表示向量;
[0135]
将每个截取后对象数据对应的表示向量进行向量融合处理,得到数据特征。
[0136]
在一实施例中,可以根据数据有效比例,对对象数据进行截取处理,得到至少一次截取后对象数据。
[0137]
例如,当数据有效比例比较高时,可以截取最新的对象数据作为截取后对象数据。例如,对象在一天内产生了多段对象数据,这说明数据有效比例比较高。然后,对象可以截取最近一个小时的对象数据作为截取后对象数据。
[0138]
又例如,当数据有效比例比较低时,可以截取对象数据有效的部分作为对象数据。
[0139]
在一实施例中,可以将截取后对象数据进行向量映射处理,得到每个截取后对象数据对应的表示向量。例如,可以将每个截取后对象数据和预设向量映射表进行匹配,根据匹配结果确定每个截取后对象数据对应的表示向量。其中,该预设向量映射表中包括了每个截取后对象数据何和其表示向量对应的映射关系。
[0140]
然后,可以将每个截取后对象数据对应的表示向量进行向量融合处理,得到数据特征。例如,可以将每个表示向量进行拼接,得到数据特征,等等。
[0141]
在一实施例中,还可以对对象数据进行位置编码(positional embedding),得到对象数据对应的位置特征。其中,有多种方式对对象数据进行位置编码,得到对象数据对应的位置特征。例如,可以直接对对象数据进行位置编码,得到对象数据对应的位置特征。又例如,可以基于数据有效比例,对对象数据进行位置编码,得到对象数据对应的位置特征。
[0142]
其中,当直接对对象数据进行位置编码时,可以利用三角函数对对象数据进行位置编码。例如,可以按照下列公式对对象数据进行位置编码:
[0143][0144][0145]
其中,t可以表示对象数据中的数据单元在对象数据中的位置。p
t
可以表示数据对应的编码。i可以是对象数据的索引(index),k的引入是为了区分奇偶。d可以是对象数据的维度。其中,对象数据中的一条数据可以称之为数据单元。
[0146]
此外,还可以利用人工智能算法对对象数据进行位置编码,得到位置特征。例如,可以利用双向编解码(bidirectional encoder representations from transformers,bert)模型、卷积神经网络(convolutional neural networks,cnn)和反卷积神经网络(de-convolutional networks,dn)等等中的任意一种人工智能算法对对象数据进行位置编码,
得到位置特征。
[0147]
在一实施例中,可以将数据特征和位置特征进行融合处理,得到对象特征。例如,可以将数据特征和位置特征进行相加或拼接,等等,得到对象特征。
[0148]
例如,可以按照下列公式将数据特征和位置特征进行融合处理,得到对象特征,具体的:
[0149][0150]
其中,可以有表示数据特征,pn可以表示位置特征,n可以表示对象数据中的第n个数据。
[0151]
在一实施例中,通过基于数据有效比例对对象数据进行编码,可以使得在对对象数据进行编码时,可以更好地利用对象数据中的有效数据。例如,当对象和应用的互动比较少时,每条对象操作数据生成时间的间隔可能会比较大,那么最近一段时间内的对象操作数据则会比较重要。而当对象和应用的互动比较多时,最近一段时间内的对象操作数据可能相对会没那么重要,因为对象可能会在很短时间内浏览大量不同类型的内容。通过基于数据有效比例对对象数据进行编码,可以提高对象特征的精确度。
[0152]
在一实施例中,当当前数据类型的对象数据是对象说明数据时,由于对象说明数据会比较固定,变化可能会比较小,因此可以直接对对象说明数据进行特征编码,得到对象特征。
[0153]
例如,可以利用bert、cnn和dn等任意一种人工智能算法对对象数据进行特征编码,得到对象特征。
[0154]
在一实施例中,当当前数据类型的对象数据是对象说明数据时,对象说明数据可以包括多个不同维度上的数据。例如,对象说明数据可以包括基本数据、长期类目数据和短期类目数据,等等。其中,基本数据可以对应一个维度、长期类目数据可以对应另外一个维度,短期类目数据又可以对应另外一个维度。
[0155]
其中,基本数据可以包括对象标识(identity document,id)、使用应用的时间和性别。
[0156]
其中,长期类目数据可以包括长期一级类目、长期二级类目和长期标签等等。
[0157]
其中,短期类目数据可以包括短期一级类目、短期二级类目和短期标签,等等。
[0158]
因此,在对对象说明数据进行特征编码时,可以对不同维度上的数据进行向量转换处理,得到每个数据维度对应的表征向量。然后,将每个数据维度对应的表征向量进行融合,得到目标表征向量。具体的,步骤“利用每个数据类型上对象数据对应的特征编码方式对所述对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征”,可以包括:
[0159]
对多个不同数据维度上的数据进行向量转换处理,得到每个数据维度上数据对应的表征向量;
[0160]
将每个数据维度上数据对应的表征向量进行融合处理,得到目标表征向量;
[0161]
对目标表征向量进行全连接处理,得到全连接特征;
[0162]
对全连接特征进行激活处理,得到对象特征。
[0163]
在一实施例中,可以将多个不同数据维度上的数据进行向量转换处理,得到每个
数据维度上数据对应的表征向量。例如,可以将每个数据维度上数据和预设向量映射表进行匹配,根据匹配结果确定每个数据维度上数据对应的表征向量。其中,该预设向量映射表中包括了每个数据维度上数据和其表征向量对应的映射关系。
[0164]
然后,可以将每个数据维度上数据对应的表征向量进行融合处理,得到目标表征向量。例如,可以将每个表征向量进行相加或拼接等等,得到目标表征向量,等等。
[0165]
在一实施例中,可以对目标表征向量进行全连接处理,得到全连接特征。例如,可以将目标表征向量通过两个全连接层,得到全连接特征。然后,可以对全连接特征进行激活处理,得到对象特征。例如,可以利用激活函数对全连接特征进行激活处理,得到对象特征。其中,激活函数可以包括tanh函数、relu函数和sigmoid函数,等等。
[0166]
例如,可以对多个不同数据维度上的数据进行embedding,并通过带掩码的平均池化方式将他们映射为一个embedding。此外,为了充分利用不同数据维度上的信息,可以使用拼接的方式将表征向量进行融合处理,得到目标表征向量。然后,可以通过两个全连接层加tanh激活函数对目标表征向量进行处理,得到对象特征。
[0167]
103、基于每个数据类型对应的对象特征,生成对象对应的属性特征。
[0168]
在一实施例中,为了可以实现通过对象数据筛选出目标待发送内容,因此在得到对象特征之后,可以基于每个数据类型对应的对象特征,生成对象对应的属性特征。
[0169]
其中,对象特征侧重于通过数字空间表示对象的对象数据,而属性特征则侧重于表示对象的兴趣爱好。而通过将对象的对象特征转换为属性特征,可以基于对象的兴趣爱好为对象推荐目标待发送内容,从而提高为对象推荐目标待发送内容的精确度。
[0170]
在一实施例中,有多种方式可以基于每个数据类型对应的对象特征,生成对象对应的属性特征。
[0171]
例如,可以利用长短期记忆神经网络(long short term memory,lstm)、序列对序列网络(sequence to sequence,seq2seq)、自注意力机制、或多头注意力机制等人工智能算法基于每个数据类型对应的对象特征,生成对象对应的属性特征。
[0172]
在一实施例中,为了提高将对象特征转换为属性特征的精确率,可以将每个数据类型对应的对象特征进行注意力融合,得到融合后特征。然后,可以基于融合后特征,生成数据特征。具体的,步骤“基于每个数据类型对应的对象特征,生成对象对应的属性特征”,可以包括:
[0173]
将每个数据类型对应的对象特征进行注意力融合,得到融合后特征;
[0174]
将融合后特征进行概率分布拟合处理,得到融合后特征对应的概率分布;
[0175]
将概率分布映射到对象对应的属性特征。
[0176]
其中,注意力融合可以包括利用注意力的方式将每种数据类型对应的对象特征进行融合。
[0177]
其中,注意力机制源于对人类视觉的研究。在认知科学中,由于信息处理的瓶颈,人类会选择性地关注所有信息的一部分,同时忽略其他可见的信息。上述机制通常被称为注意力机制。人类视网膜不同的部位具有不同程度的信息处理能力,即敏锐度,只有视网膜中央凹部位具有最强的敏锐度。为了合理利用有限的视觉信息处理资源,人类需要选择视觉区域中的特定部分,然后集中关注它。例如,人们在阅读时,通常只有少量要被读取的词会被关注和处理。
[0178]
例如,可以利用自注意力机制将对象操作数据和对象说明数据对应的对象特征进行融合,得到融合后特征。又例如,可以利用多头自注意力机制将对象操作数据和对象说明数据对应的对象特征进行融合,得到融合后特征。
[0179]
在一实施例中,可以将融合后特征进行概率分布拟合处理,得到融合后特征对应的概率分布。例如,可以利用概率计算的方式计算出融合后特征对应的概率分布。又例如,可以利用将融合后特征映射到预设概率空间中,并在该预设概率空间中确定融合后特征对应的概率分布。
[0180]
在一实施例中,在得到融合后特征对应的概率分布之后,可以将概率分布映射到对象对应的属性特征。
[0181]
例如,每个属性特征也会有对应的概率分布。因此,可以将融合后特征对应的概率分布和属性特征对应的概率分布进行匹配,从而得到概率分布对应的属性特征。
[0182]
由于不同数据类型的对象数据具有不同的特点,通过将每个数据类型对应的对象特征进行注意力融合,可以根据不同的注意力程度生成融合后特征,从而提高属性特征的准确度。
[0183]
104、对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息。
[0184]
其中,内容属性信息可以是待发送内容在数字空间中的表示。通过内容属性信息,可以知道对象对哪一类型的内容感兴趣。
[0185]
在一实施例中,由于对象的兴趣往往是多样的,而不是单一的,因此,可以对属性特征进行多属性维度的内容映射,得到对象在至少两个属性维度上的内容属性信息。通过将属性特征进行多属性维度的内容映射,可以基于对象的多个兴趣为对象筛选目标待发送内容,从而提高筛选目标待发送内容的准确度。
[0186]
其中,有多种方式可以对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息。
[0187]
在一实施例中,可以利用自注意力机制对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息。具体的,步骤“对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息”,可以包括:
[0188]
基于自注意力机制对属性特征进行至少两个属性维度上的信息提取,得到属性特征对应的多维自注意力信息;
[0189]
利用多维自注意力信息将属性特征转换为对象在至少两个属性维度上的内容属性信息。
[0190]
其中,对至少两个属性维度上的信息进行信息提取,可以将对象的属性特征进行扩展,得到对象多维自注意力信息。通过对为注意力信息,可以将对象的属性特征表征到兴趣隐空间中。具体的,步骤“利用自注意力机制对属性特征进行至少两个属性维度上的信息提取,得到属性特征对应的多维自注意力信息”,可以包括:
[0191]
基于自注意力机制,对属性特征进行特征定位,得到定位信息;
[0192]
基于自注意力机制,将定位信息映射到多维内容属性特征空间中,得到映射结果;
[0193]
基于自注意力机制,对映射结果进行逻辑回归处理,得到多维自注意力信息。
[0194]
其中,基于自注意力机制对属性特征进行特征定位可以指基于自注意力机制关注
属性特征中的重点信息。
[0195]
其中,自注意力机制中可以具有多个可以调节的参数,因此,可以利用自注意力机制中的参数对属性特征进行特征定位,得到定位信息。例如,可以利用自注意力机制中的参数和属性特征进行相乘后再利用三角函数进行定位,得到定位信息。
[0196]
然后,可以基于自注意力机制将定位信息映射到多维内容属性特征空间中,得到映射结果。例如,可以将定位信息和自注意力机制中的预设多维空间属性参数进行相乘,从而将定位信息映射到多维内容属性特征空间中。其中,该预设多维空间属性参数可以是一个训练好的矩阵,可以准确地将定位信息映射到多维内容属性特征空间中。
[0197]
然后,可以基于自注意力机制,对映射结果进行逻辑回归处理,得到多维自注意力信息。其中,可以利用自注意力机制中携带的逻辑回归函数对映射结果进行逻辑回归处理,得到多维自注意力信息。例如,可以利用softmax函数等对映射结果进行逻辑回归处理,得到多维自注意力信息。
[0198]
在一实施例中,可以按照下列公式对属性特征进行至少两个属性维度上的信息提取,得到属性特征对应的多维自注意力信息,具体的:
[0199][0200]
其中,hd×n可以表示属性特征,n为属性特征的长度,d为属性特征的维度。和是可训练的参数,k为属性维度的个数,a为多维自注意力信息。
[0201]
在一实施例中,在得到多维自注意力信息之后,可以利用多维自注意力信息将属性特征转换为对象在至少两个属性维度上的内容属性信息。
[0202]
例如,可以将属性特征和多维自注意力信息进行相乘,得到至少两个属性维度上的内容属性信息。譬如,如下列公式所示:
[0203]vu
=ha
[0204]
其中,可以表示多属性维度上的内容属性信息。
[0205]
又例如,可以将属性特征和多维自注意力信息进行点乘,得到至少两个属性维度上的内容属性信息,等等。
[0206]
在一实施例中,在基于自注意力机制对属性特征进行至少两个属性维度上的信息提取,得到属性特征对应的多维自注意力信息之前,可以对初始自注意力机制进行训练,得到自注意力机制。具体的,本技术实施例提出的方法还可以包括:
[0207]
获取初始自注意力机制和对象样本数据;
[0208]
基于对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;
[0209]
计算目标待发送样本内容和对象样本数据之间的契合度信息;
[0210]
基于契合度信息对初始自注意力机制进行调整,得到自注意力机制。
[0211]
其中,初始自注意力机制可以包括未经过训练,性能未达到要求的机制。
[0212]
其中,对象样本数据可以包括对初始自注意力机制进行训练时使用到的数据。例如,该对象样本数据可以是对象在至少两个数据类型上的数据,其中,该对象样本数据可以是对象的历史数据。而在步骤101中获取对象在至少两个数据类型上的对象数据,该对象数据可以是对象的实时数据。
[0213]
其中,待发送样本内容可以包括对初始自注意力机制进行训练时使用到的数据
[0214]
在一实施例中,可以基于对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容,即利用对象样本数据对初始自注意力机制进行训练。例如,可以对对象样本数据进行特征编码处理,得到对象样本特征。然后,可以利用对象样本特征,得到样本属性特征。然后,对样本属性特征进行内容映射处理,得到样本内容属性信息。然后,基于样本内容属性信息,从待发送样本内容中筛选出至少两个目标待发送样本内容。其中,在对样本属性特征进行内容映射处理时,可以利用初始注意力机制对样本属性特征进行内容映射处理,得到样本属性特征。
[0215]
在一实施例中,可以计算目标待发送样本内容和对象样本数据对应对象的契合度信息。例如,可以将对象样本数据转换为对象样本特征。然后,计算目标待发送样本内容和对象样本特征之间的契合度信息。例如,可以按照下列公式计算目标待发送样本内容和对象样本数据之间的契合度信息。具体的:
[0216][0217]
其中,vu可以表示对对象样本特征,ei可以表示目标待发送样本内容,p
θ
(i|u)可以表示契合度信息,i可以表示第i个内容,u可以表示第u个对象。
[0218]
在一实施例中,可以基于契合度信息对初始自注意力机制进行调整,得到自注意力机制。例如,可以将契合度信息转换为损失信息,然后,基于损失函数对初始自注意力机制进行调整,得到自注意力机制。
[0219]
其中,可以按照下列公式将契合度信息转换为损失信息:
[0220][0221]
然后,可以利用损失信息loss对初始自注意力机制中的参数进行调整,得到自注意力机制。例如,初始自注意力机制可以如下列公式所示:
[0222][0223]
则在对初始自注意力机制中的参数进行调整时,可以对参数w2和w1进行调整。
[0224]
在一实施例中,通过自注意力机制对属性特征进行多属性维度的内容映射处理,可以在关注重点的前提下,将对象的属性特征进行扩充,从而提高得到的内容属性信息的准确性。
[0225]
在一实施例中,本技术实施例提出了一个全局属性嵌入字典,可以利用该全局属性嵌入字典对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息。具体的,步骤“对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息”,可以包括:
[0226]
获取全局属性嵌入字典,全局属性嵌入字典包括多个参考内容属性信息,其中,不同的参考内容属性信息对应不同的属性维度;
[0227]
计算多个参考内容属性信息和属性特征之间的相似度信息;
[0228]
根据相似度信息,从多个参考内容属性信息中筛选出至少两个属性维度上的内容属性信息。
[0229]
其中,该全局属性嵌入字典可以表示所有被考虑到的兴趣集合。该兴趣属性嵌入字典是可以学习的,其中,该兴趣属性嵌入字典中的兴趣总数可以是超参数,可以根据任务特点进行设定。例如,在某个应用中,可以将对象的兴趣总数划分为50个,该全局属性嵌入字典包括50个参考内容属性信息,即可以认为在总的兴趣空间中,对象的隐兴趣可以被该50个参考内容属性信息进行区分,隐兴趣可以被全体用户的兴趣聚类为50类,这些兴趣也可认为是体现了大多数对象的重要兴趣分布。其中,参考内容属性信息可以是待发送内容在数字空间中的表示。
[0230]
在一实施例中,可以计算多个参考内容属性信息和属性特征之间的相似度信息。其中,有多种方式计算多个参考内容属性信息和属性特征之间的相似度信息。例如,可以通过余弦相似度、欧几里得距离或皮尔逊相关系数等方式计算多个参考内容属性信息和属性特征之间的相似度信息。
[0231]
例如,可以计算属性特征和每个参考内容属性信息之间的余弦相似度,得到相似度信息。
[0232]
在一实施例中,可以根据相似度信息,从多个参考内容属性信息中筛选出至少两个属性维度上的内容属性信息。例如,可以对相似度信息进行排序,然后选择topk个最相似的参考内容属性信息作为内容属性信息。
[0233]
在一实施例中,由于全局属性嵌入字典是可以学习的,所以本技术实施例提出的方法还可以包括:
[0234]
获取初始属性嵌入字典和对象样本数据,初始属性嵌入字典包括多个初始内容属性信息;
[0235]
基于对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;
[0236]
计算目标待发送样本内容和预设样本标签之间的损失信息;
[0237]
基于损失信息更新初始属性嵌入字典中的初始内容属性信息,得到全局属性嵌入字典。
[0238]
在一实施例中,可以基于对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容,即利用对象样本数据对初始属性嵌入字典进行训练。例如,可以对对象样本数据进行特征编码处理,得到对象样本特征。然后,可以利用对象样本特征,得到样本属性特征。然后,基于样本内容属性信息,从待发送样本内容中筛选出至少两个目标待发送样本内容。其中,在对样本属性特征进行内容映射处理时,可以利用初始属性嵌入字典对样本属性特征进行内容映射处理,得到样本属性特征。
[0239]
在一实施例中,可以计算目标待发送样本内容和预设样本标签之间的损失信息;然后,基于损失信息更新初始属性嵌入字典中的初始内容属性信息,得到全局属性嵌入字典。
[0240]
在一实施例中,通过利用全局属性嵌入字典对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息。由于全局属性嵌入字典中限定了内容属性信息的范围,所以会令全局属性嵌入字典的学习比较容易,即在限定的范围内进行学习,从而使得学习得到的全局属性嵌入字典的准确率会较高。此外,当对象样本数据比较稀疏时,由于全局属性嵌入字典中限定了内容属性信息的范围,因此初始属性嵌入字典在学习的过程中,不会被冷漠的兴趣干扰,从而使得全局属性嵌入字典的准确率会较高。
由于全局属性嵌入字典的准确率会比较高,所以基于全局属性嵌入字典得到的内容属性信息的准确率也会更高,从而提高了筛选出目标待发送内容的准确率。
[0241]
105、基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。
[0242]
在一实施例中,可以基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。
[0243]
其中,在筛选出至少两个目标待发送内容时,可以首先基于至少两个属性维度上的内容属性信息从待发送内容中召回大量的结果。然后,可以对大量的召回结果按照特定规则(例如,时效性、地域、多样性等等)进行再次筛选,得到目标待发送内容。
[0244]
其中,在筛选出目标待发送内容之后,可以对目标待发送内容进行排序,并将排序后的结果展示给对象。例如,可以将对象兴趣更高的目标待发送内容排序在前面,而将对象兴趣较低的目标待发送内容排序在后面。又例如,在对目标待发送内容进行排序时,可以利用点击率预估模型对目标待发送内容排序。例如,可以将对象点击可能性更高的目标待发送内容排在前面,而将对象点击可能性更低的目标待发送内容排在后面。
[0245]
此外,由于对召回结果进行再次筛选,所以在对目标待发送内容进行排序时,可以减少对目标待发送内容进行排序的计算规模,提高排序效率。
[0246]
在一实施例中,由于对象在使用应用时,由于对象在线的上下文环境是动态的,即对象在应用中浏览的内容是动态变化的,所以本技术实施例可以在线获取对象在至少两个数据类型上的对象数据,并在线地生成对象的对象特征,这样才可以实时地捕获对象在这个时刻的兴趣偏好。
[0247]
由上可知,本实施例可以获取对象在至少两个数据类型上的对象数据;对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;基于每个数据类型对应的对象特征,生成对象对应的属性特征;对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息;基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。在本技术实施例中,首先会基于至少两个数据类型上的对象数据筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。由于基于至少两个数据类型上的对象数据,所以会使得筛选出的至少两个目标待发送内容更有依据,所以提高了筛选出目标待发送内容的精确性。其次,在本技术实施例中,会对属性特征进行多属性维度的内容映射处理,即从多属性维度考虑对象会感兴趣的内容,因此可以进一步地提高筛选出目标待发送内容的精确性。
[0248]
根据前面实施例所描述的方法,以下将以该内容发送装置具体集成在服务器举例作进一步详细说明。
[0249]
本技术实施例提供一种内容发送方法,如图2a所示,该内容发送方法的具体流程可以如下:
[0250]
201、服务器获取对象在至少两个数据类型上的对象数据。
[0251]
例如,如图2b和2c所示,服务器可以获取对象在应用中至少两个数据类型上的对象数据。其中,该应用可以是社交软件。
[0252]
其中,至少两个数据类型上的对象数据可以包括对象操作数据和对象说明数据。
[0253]
其中,对象说明数据可以包括多个数据维度上的数据。例如,对象说明数据可以包括基本数据、长期类目数据和短期类目项目。
[0254]
202、服务器对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。
[0255]
例如,如图2b和2c所示,对于对象说明数据,可以分别对基本数据、长期类目数据和短期类目数据进行向量转换(embedding)处理,并通过带掩码的平均池化方式将他们分别映射为一个embedding。为了充分利用三个层次的信息,可以使用拼接的方式将他们融合,并通过两个全连接层加tanh激活函数进一步提高对象特征的表征能力。
[0256]
例如,如图2b和2c所示,对于对象操作数据,考虑到不同对象和社交软件中内容的交互可能有多也有少。例如,当交互较少时,交互较少时,对象操作数据相隔时间可能相差很大,那么此时相近时间的历史对象操作数据表现的更为重要;而当交互较多时,相近对象操作数据不是很重要,因为对象会在很短的时间内浏览大量的不同类型的内容。因此,可以使用自注意力机制对对象操作数据进行数据编码,从而可以利用自注意力机制关注不同的模式和重点。此外,还可以加入位置编码(positionnal embedding)对对象操作数据进行表征。然后,可以将数据特征和位置特征进行相加,得到对象特征。
[0257]
203、服务器基于每个数据类型对应的对象特征,生成对象对应的属性特征。
[0258]
例如,例如,如图2b和2c所示,服务器可以基于自注意力机制将对象特征转换为属性特征。
[0259]
204、服务器对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息。
[0260]
例如,如图2b所示,服务器可以按照下列公式基于每个数据类型对应的对象特征,生成对象对应的内容属性信息:
[0261][0262]
又例如,如图2c所示,服务器可以基于全局兴趣嵌入字典将对象特征转换为内容属性信息。
[0263]
205、服务器基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。
[0264]
由上可知,本实施例服务器可以获取对象在至少两个数据类型上的对象数据;服务器对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;服务器基于每个数据类型对应的对象特征,生成对象对应的属性特征;服务器对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息;服务器基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。在本技术实施例中,首先会基于至少两个数据类型上的对象数据筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。由于基于至少两个数据类型上的对象数据,所以会使得筛选出的至少两个目标待发送内容更有依据,所以提高了筛选出目标待发送内容的精确性。其次,在本技术实施例中,会对属性特征进行多属性维度的内容映射处理,即从多属性维度考虑对象会感兴趣的内容,因此可以进一步地提高筛选出目标待发送内容的精确性。
[0265]
为了更好地实施以上方法,本技术实施例还提供一种内容发送装置,如图3所示,
该内容发送装置可以包括获取单元301、特征编码单元302、生成单元303、内容映射单元304和筛选单元305,如下:
[0266]
获取单元301,用于获取对象在至少两个数据类型上的对象数据;
[0267]
特征编码单元302,用于对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;
[0268]
生成单元303,用于基于每个数据类型对应的对象特征,生成所述对象对应的属性特征;
[0269]
内容映射单元304,用于对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息;
[0270]
筛选单元305,用于基于所述至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将所述目标待发送内容发送给所述对象。
[0271]
在一实施例中,所述内容映射单元304,可以包括:
[0272]
第一获取子单元,用于获取全局属性嵌入字典,所述全局属性嵌入字典包括多个参考内容属性信息,其中,不同的参考内容属性信息对应不同的属性维度;
[0273]
第一计算子单元,用于计算所述多个参考内容属性信息和所述属性特征之间的相似度信息;
[0274]
第一筛选子单元,用于根据所述相似度信息,从所述多个参考内容属性信息中筛选出至少两个属性维度上的内容属性信息。
[0275]
在一实施例中,所述内容映射单元304,还可以包括:
[0276]
第二获取子单元,用于获取初始属性嵌入字典和对象样本数据,所述初始属性嵌入字典包括多个初始内容属性信息;
[0277]
第二筛选子单元,用于基于所述对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;
[0278]
第二计算子单元,用于计算所述目标待发送样本内容和预设样本标签之间的损失信息;
[0279]
第一更新子单元,用于基于所述损失信息更新所述初始属性嵌入字典中的初始内容属性信息,得到全局属性嵌入字典。
[0280]
在一实施例中,所述内容映射单元304,可以包括:
[0281]
信息提取子单元,用于基于自注意力机制对所述属性特征进行至少两个属性维度上的信息提取,得到所述属性特征对应的多维自注意力信息;
[0282]
转换子单元,用于利用所述多维自注意力信息将所述属性特征转换为所述对象在至少两个属性维度上的内容属性信息。
[0283]
在一实施例中,所述信息提取子单元,可以包括:
[0284]
特征定位模块,用于基于所述自注意力机制,对所述属性特征进行特征定位,得到定位信息;
[0285]
第一映射模块,用于基于所述自注意力机制,将所述定位信息映射到多维内容属性特征空间中,得到映射结果;
[0286]
逻辑回归模块,用于基于所述自注意力机制,对所述映射结果进行逻辑回归处理,得到所述多维自注意力信息。
[0287]
在一实施例中,所述内容映射单元304,还可以包括:
[0288]
第三获取子单元,用于获取初始自注意力机制和对象样本数据;
[0289]
第三筛选子单元,用于基于所述对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;
[0290]
第三计算子单元,用于计算所述目标待发送样本内容和所述对象样本数据之间的契合度信息;
[0291]
调整子单元,用于基于所述契合度信息对所述初始自注意力机制进行调整,得到自注意力机制。
[0292]
在一实施例中,所述特征编码单元302,可以包括:
[0293]
识别子单元,用于对所述至少两个数据类型上的对象数据进行识别,得到每个数据类型上对象数据对应的特征编码方式;
[0294]
特征编码子单元,用于利用每个数据类型上对象数据对应的特征编码方式对所述对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。
[0295]
在一实施例中,所述特征编码子单元,可以包括:
[0296]
向量转换模块,用于对所述多个不同数据维度上的数据进行向量转换处理,得到每个数据维度上数据对应的表征向量;
[0297]
第一融合模块,用于将每个数据维度上数据对应的表征向量进行融合处理,得到目标表征向量;
[0298]
全连接模块,用于对所述目标表征向量进行全连接处理,得到全连接特征;
[0299]
激活模块,用于对所述全连接特征进行激活处理,得到所述对象特征。
[0300]
在一实施例中,所述特征编码子单元,可以包括:
[0301]
识别模块,用于对所述数据类型上的对象数据进行识别,得到所述对象数据的数据有效比例;
[0302]
数据编码模块,用于根据所述数据有效比例,对所述对象数据进行数据编码,得到所述对象数据对应的数据特征;
[0303]
位置编码模块,用于对所述对象数据进行位置编码,得到所述对象数据对应的位置特征;
[0304]
第二融合模块,用于将所述数据特征和所述位置特征进行融合处理,得到所述对象特征。
[0305]
在一实施例中,所述数据编码模块,可以包括:
[0306]
截取子模块,用于根据所述数据有效比例,对所述对象数据进行截取处理,得到至少一次截取后对象数据;
[0307]
向量映射子模块,用于将所述截取后对象数据进行向量映射处理,得到每个截取后对象数据对应的表示向量;
[0308]
向量融合子模块,用于将每个截取后对象数据对应的表示向量进行向量融合处理,得到所述数据特征。
[0309]
在一实施例中,所述生成单元303,可以包括:
[0310]
注意力融合子单元,用于将每个数据类型对应的对象特征进行注意力融合,得到融合后特征;
[0311]
分布拟合子单元,用于将所述融合后特征进行概率分布拟合处理,得到所述融合后特征对应的概率分布;
[0312]
特征映射子单元,用于将所述概率分布映射到所述对象对应的属性特征。
[0313]
由上可知,本实施例由获取单元301获取对象在至少两个数据类型上的对象数据;特征编码单元302对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;生成单元303基于每个数据类型对应的对象特征,生成对象对应的属性特征;内容映射单元304对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息;筛选单元305基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。在本技术实施例中,首先会基于至少两个数据类型上的对象数据筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象。由于基于至少两个数据类型上的对象数据,所以会使得筛选出的至少两个目标待发送内容更有依据,所以提高了筛选出目标待发送内容的精确性。其次,在本技术实施例中,会对属性特征进行多属性维度的内容映射处理,即从多属性维度考虑对象会感兴趣的内容,因此可以进一步地提高筛选出目标待发送内容的精确性。
[0314]
本技术实施例还提供一种电子设备,如图4所示,其示出了本技术实施例所涉及的电子设备的结构示意图,该电子设备可以是终端或者服务器等,具体来讲:
[0315]
该电子设备可以包括一个或者一个以上处理核心的处理器401、一个或一个以上计算机可读存储介质的存储器402、电源403和输入单元404等部件。本领域技术人员可以理解,图4中示出的电子设备结构并不构成对电子设备的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件布置。其中:
[0316]
处理器401是该电子设备的控制中心,利用各种接口和线路连接整个电子设备的各个部分,通过运行或执行存储在存储器402内的软件程序和/或模块,以及调用存储在存储器402内的数据,执行电子设备的各种功能和处理数据。可选的,处理器401可包括一个或多个处理核心;优选的,处理器401可集成应用处理器和调制解调处理器,其中,应用处理器主要处理操作系统、用户界面和应用程序等,调制解调处理器主要处理无线通信。可以理解的是,上述调制解调处理器也可以不集成到处理器401中。
[0317]
存储器402可用于存储软件程序以及模块,处理器401通过运行存储在存储器402的软件程序以及模块,从而执行各种功能应用以及数据处理。存储器402可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。此外,存储器402可以包括高速随机存取存储器,还可以包括非易失性存储器,例如至少一个磁盘存储器件、闪存器件、或其他易失性固态存储器件。相应地,存储器402还可以包括存储器控制器,以提供处理器401对存储器402的访问。
[0318]
电子设备还包括给各个部件供电的电源403,优选的,电源403可以通过电源管理系统与处理器401逻辑相连,从而通过电源管理系统实现管理充电、放电、以及功耗管理等功能。电源403还可以包括一个或一个以上的直流或交流电源、再充电系统、电源故障检测电路、电源转换器或者逆变器、电源状态指示器等任意组件。
[0319]
该电子设备还可包括输入单元404,该输入单元404可用于接收输入的数字或字符
信息,以及产生与用户设置以及功能控制有关的键盘、鼠标、操作杆、光学或者轨迹球信号输入。
[0320]
尽管未示出,该电子设备还可以包括显示单元等,在此不再赘述。具体在本实施例中,电子设备中的处理器401会按照如下的指令,将一个或一个以上的应用程序的进程对应的可执行文件加载到存储器402中,并由处理器401来运行存储在存储器402中的应用程序,从而实现各种功能,如下:
[0321]
获取对象在至少两个数据类型上的对象数据;
[0322]
对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;
[0323]
基于每个数据类型对应的对象特征,生成所述对象对应的属性特征;
[0324]
对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息;
[0325]
基于所述至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将所述目标待发送内容发送给所述对象。
[0326]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0327]
由上可知,本实施例获取对象在至少两个数据类型上的对象数据;对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;基于每个数据类型对应的对象特征,生成对象对应的属性特征;对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息;基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象,可以提高从海量内容中筛选出目标待发送内容并发送给对象的精确度。
[0328]
本领域普通技术人员可以理解,上述实施例的各种方法中的全部或部分步骤可以通过指令来完成,或通过指令控制相关的硬件来完成,该指令可以存储于一计算机可读存储介质中,并由处理器进行加载和执行。
[0329]
为此,本技术实施例提供一种存储介质,其中存储有多条指令,该指令能够被处理器进行加载,以执行本技术实施例所提供的任一种内容发送方法中的步骤。例如,该指令可以执行如下步骤:
[0330]
获取对象在至少两个数据类型上的对象数据;
[0331]
对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;
[0332]
基于每个数据类型对应的对象特征,生成所述对象对应的属性特征;
[0333]
对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息;
[0334]
基于所述至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将所述目标待发送内容发送给所述对象。
[0335]
以上各个操作的具体实施可参见前面的实施例,在此不再赘述。
[0336]
其中,该存储介质可以包括:只读存储器(rom,read only memory)、随机存取记忆体(ram,random access memory)、磁盘或光盘等。
[0337]
由于该存储介质中所存储的指令,可以执行本技术实施例所提供的任一种内容发送方法中的步骤,因此,可以实现本技术实施例所提供的任一种内容发送方法所能实现的有益效果,详见前面的实施例,在此不再赘述。
[0338]
根据本技术的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述内容发送方面的各种可选实现方式中提供的方法。
[0339]
以上对本技术实施例所提供的一种内容发送方法、装置、电子设备和存储介质进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
技术特征:
1.一种内容发送方法,其特征在于,包括:获取对象在至少两个数据类型上的对象数据;对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;基于每个数据类型对应的对象特征,生成所述对象对应的属性特征;对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息;基于所述至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将所述目标待发送内容发送给所述对象。2.根据权利要求1所述的方法,其特征在于,所述对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息,包括:获取全局属性嵌入字典,所述全局属性嵌入字典包括多个参考内容属性信息,其中,不同的参考内容属性信息对应不同的属性维度;计算所述多个参考内容属性信息和所述属性特征之间的相似度信息;根据所述相似度信息,从所述多个参考内容属性信息中筛选出至少两个属性维度上的内容属性信息。3.根据权利要求2所述的方法,其特征在于,所述方法还包括:获取初始属性嵌入字典和对象样本数据,所述初始属性嵌入字典包括多个初始内容属性信息;基于所述对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;计算所述目标待发送样本内容和预设样本标签之间的损失信息;基于所述损失信息更新所述初始属性嵌入字典中的初始内容属性信息,得到全局属性嵌入字典。4.根据权利要求1所述的方法,其特征在于,所述对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息,包括:基于自注意力机制对所述属性特征进行至少两个属性维度上的信息提取,得到所述属性特征对应的多维自注意力信息;利用所述多维自注意力信息将所述属性特征转换为所述对象在至少两个属性维度上的内容属性信息。5.根据权利要求4所述的方法,其特征在于,所述利用自注意力机制对所述属性特征进行至少两个属性维度上的信息提取,得到所述属性特征对应的多维自注意力信息,包括:基于所述自注意力机制,对所述属性特征进行特征定位,得到定位信息;基于所述自注意力机制,将所述定位信息映射到多维内容属性特征空间中,得到映射结果;基于所述自注意力机制,对所述映射结果进行逻辑回归处理,得到所述多维自注意力信息。6.根据权利要求4所述的方法,其特征在于,所述方法还包括:获取初始自注意力机制和对象样本数据;基于所述对象样本数据,从待发送样本内容中筛选出至少两个目标待发送样本内容;
计算所述目标待发送样本内容和所述对象样本数据之间的契合度信息;基于所述契合度信息对所述初始自注意力机制进行调整,得到自注意力机制。7.根据权利要求1所述的方法,其特征在于,所述对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征,包括:对所述至少两个数据类型上的对象数据进行识别,得到每个数据类型上对象数据对应的特征编码方式;利用每个数据类型上对象数据对应的特征编码方式对所述对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征。8.根据权利要求7所述的方法,其特征在于,所述数据类型上的对象数据包括多个不同数据维度上的数据;所述利用每个数据类型上对象数据对应的特征编码方式对所述对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征,包括:对所述多个不同数据维度上的数据进行向量转换处理,得到每个数据维度上数据对应的表征向量;将每个数据维度上数据对应的表征向量进行融合处理,得到目标表征向量;对所述目标表征向量进行全连接处理,得到全连接特征;对所述全连接特征进行激活处理,得到所述对象特征。9.根据权利要求7所述的方法,其特征在于,所述利用每个数据类型上对象数据对应的特征编码方式对所述对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征,包括:对所述数据类型上的对象数据进行识别,得到所述对象数据的数据有效比例;根据所述数据有效比例,对所述对象数据进行数据编码,得到所述对象数据对应的数据特征;对所述对象数据进行位置编码,得到所述对象数据对应的位置特征;将所述数据特征和所述位置特征进行融合处理,得到所述对象特征。10.根据权利要求9所述的方法,其特征在于,所述根据所述数据有效比例,对所述对象数据进行数据编码,得到所述对象数据对应的数据特征,包括:根据所述数据有效比例,对所述对象数据进行截取处理,得到至少一次截取后对象数据;将所述截取后对象数据进行向量映射处理,得到每个截取后对象数据对应的表示向量;将每个截取后对象数据对应的表示向量进行向量融合处理,得到所述数据特征。11.根据权利要求1所述的方法,其特征在于,所述基于每个数据类型对应的对象特征,生成所述对象对应的属性特征,包括:将每个数据类型对应的对象特征进行注意力融合,得到融合后特征;将所述融合后特征进行概率分布拟合处理,得到所述融合后特征对应的概率分布;将所述概率分布映射到所述对象对应的属性特征。12.内容发送装置,其特征在于,包括:获取单元,用于获取对象在至少两个数据类型上的对象数据;
特征编码单元,用于对所述至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;生成单元,用于基于每个数据类型对应的对象特征,生成所述对象对应的属性特征;内容映射单元,用于对所述属性特征进行多属性维度的内容映射处理,得到所述对象在至少两个属性维度上的内容属性信息;筛选单元,用于基于所述至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将所述目标待发送内容发送给所述对象。13.一种计算机设备,其特征在于,包括存储器和处理器;所述存储器存储有应用程序,所述处理器用于运行所述存储器内的应用程序,以执行权利要求1至11任一项所述的内容发送方法中的操作。14.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有多条指令,所述指令适于处理器进行加载,以执行权利要求1至11任一项所述的内容发送方法中的步骤。15.一种计算机程序产品,包括计算机程序或指令,其特征在于,该计算机程序或指令被处理器执行时实现权利要求1至11任一项所述的内容发送方法中的步骤。
技术总结
本申请公开了一种内容发送方法、装置、电子设备和存储介质;本申请获取对象在至少两个数据类型上的对象数据;对至少两个数据类型上的对象数据进行特征编码处理,得到每个数据类型上对象数据对应的对象特征;基于每个数据类型对应的对象特征,生成对象对应的属性特征;对属性特征进行多属性维度的内容映射处理,得到对象在至少两个属性维度上的内容属性信息;基于至少两个属性维度上的内容属性信息,从待发送内容中筛选出至少两个目标待发送内容,并将目标待发送内容发送给对象,可以提高从海量内容中筛选出目标待发送内容并发送给对象的精确度。精确度。精确度。
技术研发人员:王良栋 张博 饶君 梅家洁
受保护的技术使用者:腾讯科技(深圳)有限公司
技术研发日:2022.03.15
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/