电视节目单推荐方法及系统与流程
未命名
09-03
阅读:149
评论:0

1.本发明涉及大数据处理技术领域,具体地说是电视节目单推荐方法及系统。
背景技术:
2.节目播单推荐借助大数据和人工智能,对用户的行为数据深度挖掘,能够深刻了解用户的兴趣偏好,从而推荐出符合用户兴趣的节目播单,提升用户的粘性和体验。
3.同时,播单推荐也需要人工调控来进行推荐策略调整,对某些类型的影片进行重点推荐或减少推荐,以对智能推荐的播单进行优化和调节,以对用户进行引导,进而实现商业目的和商业运营需要。
4.如何高效精确的为用户推荐播单,是需要解决的技术问题。
技术实现要素:
5.本发明的技术任务是针对以上不足,提供电视节目单推荐方法及系统,来解决如何高效精确的为用户推荐播单的技术问题。
6.第一方面,本发明一种电视节目单推荐方法,包括如下步骤:
7.采集多个用户的用户观看历史数据,并对用户观看历史数据进行数据清洗,得到预处理后用户观看历史数据,所述用户观看历史数据包括用户终端id、频道id、节目id和用户观看时长,所述用户观看时长包括直播模式下每个频道的观看时长以及回播模式下每个节目的观看时长;
8.对用户观看时长进行归一化处理,并对用户观看时长进行打分,每个观看时长对应一个分数,得到用户观看时长分数;
9.对于每个节目,为每个节目设定至少一个标签,并基于用户观看时长设定每个标签的赋分权重,得到每个节目在每个标签下的赋分权重;
10.基于用户观看时长分数以及每个节目在每个标签下的赋分权重,计算每个用户对每个节目的评分;
11.基于每个用户对每个节目的评分,为每个用户推荐播单。
12.作为优选,所述用户终端id包括设备id和机顶盒id。
13.作为优选,对用户观看历史数据进行数据清洗,包括如下步骤:
14.去除用户终端id、频道id或节目id为空的用户观看历史数据;
15.去除用户观看历史数据中重复的数据;
16.去除小于预定时间的用户观看时长以及对应的用户终端id以及节目id或频道id。
17.作为优选,每个用户对每个节目的评分标记为s2,计算公式如下:
[0018][0019]
其中,s2为二次评分分数,s1为一次评分分数,n为该影片的标签总个数,cn为第n个被干预标签的干预指数,未被干预的标签干预指数默认值为1。
[0020]
作为优选,基于物品协同过滤方法构建推荐模型,所述推荐模型用于基于用户终端id、节目id以及每个用户对每个节目的评分为用户推荐播单;
[0021]
基于用户终端id、节目id以及每个用户对每个节目的评分构建样本数据,基于样本数据对推荐模型进行训练,得到训练后推荐模型;
[0022]
对于每个用户,基于训练后推荐模型为用户推荐播单。
[0023]
第二方面,本发明一种电视节目单推荐系统,通过如第一方面任一项所述的一种电视节目单推荐方法为用户推荐节目播单,所述系统包括:
[0024]
数据采集模块,所述数据采集模块用于采集多个用户的用户观看历史数据,并对用户观看历史数据进行数据清洗,得到预处理后用户观看历史数据,所述用户观看历史数据包括用户终端id、频道id、节目id和用户观看时长,所述用户观看时长包括直播模式下每个频道的观看时长以及回播模式下每个节目的观看时长;
[0025]
时长打分模块,所述时长打分模块用于对用户观看时长进行归一化处理,并对用户观看时长进行打分,每个观看时长对应一个分数,得到用户观看时长分数;
[0026]
节目赋分模块,对于每个节目,所述节目赋分模块用于为每个节目设定至少一个标签,并基于用户观看时长设定每个标签的赋分权重,得到每个节目在每个标签下的赋分权重;
[0027]
节目打分模块,所述节目打分模块用于基于用户观看时长分数以及每个节目在每个标签下的赋分权重,计算每个用户对每个节目的评分;
[0028]
播单推荐模块,所述播单推荐模块用于基于每个用户对每个节目的评分,为每个用户推荐播单。
[0029]
作为优选,所述用户终端id包括设备id和机顶盒id。
[0030]
作为优选,所述数据采集模块用于执行如下对用户观看历史数据进行数据清洗:
[0031]
去除用户终端id、频道id或节目id为空的用户观看历史数据;
[0032]
去除用户观看历史数据中重复的数据;
[0033]
去除小于预定时间的用户观看时长以及对应的用户终端id以及节目id或频道id。
[0034]
作为优选,每个用户对每个节目的评分标记为s2,计算公式如下:
[0035][0036]
其中,s2为二次评分分数,s1为一次评分分数,n为该影片的标签总个数,cn为第n个被干预标签的干预指数,未被干预的标签干预指数默认值为1。
[0037]
作为优选,所述播单推荐模块用于执行如下:
[0038]
基于物品协同过滤方法构建推荐模型,所述推荐模型用于基于用户终端id、节目id以及每个用户对每个节目的评分为用户推荐播单;
[0039]
基于用户终端id、节目id以及每个用户对每个节目的评分构建样本数据,基于样本数据对推荐模型进行训练,得到训练后推荐模型;
[0040]
对于每个用户,基于训练后推荐模型为用户推荐播单。
[0041]
本发明的电视节目单推荐方法及系统具有以下优点:基于用户观看历史行为实现个性化推荐,基于人工管控系统进行人工干预调整节目播单生成,最终通过协同矩阵来实现电视节目播单的智能化推荐,融入了人工干预对推荐播单进行干预和引导,有效节省推
荐时间,提高推荐的精准度和速度,同时对用户播单调整以实现商业目标。
附图说明
[0042]
为了更清楚地说明本发明实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域的普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0043]
下面结合附图对本发明进一步说明。
[0044]
图1为实施例1一种电视节目单推荐方法的流程框图。
具体实施方式
[0045]
下面结合附图和具体实施例对本发明作进一步说明,以使本领域的技术人员可以更好地理解本发明并能予以实施,但所举实施例不作为对本发明的限定,在不冲突的情况下,本发明实施例以及实施例中的技术特征可以相互结合。
[0046]
本发明实施例提供电视节目单推荐方法及系统,用于解决如何高效精确的为用户推荐播单的技术问题。
[0047]
实施例1:
[0048]
本发明一种电视节目单推荐方法,包括如下步骤:
[0049]
s100、采集多个用户的用户观看历史数据,并对用户观看历史数据进行数据清洗,得到预处理后用户观看历史数据,所述用户观看历史数据包括用户终端id、频道id、节目id和用户观看时长,所述用户观看时长包括直播模式下每个频道的观看时长以及回播模式下每个节目的观看时长;
[0050]
s200、对用户观看时长进行归一化处理,并对用户观看时长进行打分,每个观看时长对应一个分数,得到用户观看时长分数;
[0051]
s300、对于每个节目,为每个节目设定至少一个标签,并基于用户观看时长设定每个标签的赋分权重,得到每个节目在每个标签下的赋分权重;
[0052]
s400、基于用户观看时长分数以及每个节目在每个标签下的赋分权重,计算每个用户对每个节目的评分;
[0053]
s500、基于每个用户对每个节目的评分,为每个用户推荐播单。
[0054]
本实施例中用户终端id包括设备id和机顶盒id,以设备id和机顶盒id区分用户。
[0055]
步骤s100对用户观看历史数据进行数据清洗,包括如下步骤:
[0056]
(1)去除用户终端id、频道id或节目id为空的用户观看历史数据;
[0057]
(2)去除用户观看历史数据中重复的数据;
[0058]
(3)去除小于预定时间的用户观看时长以及对应的用户终端id以及节目id或频道id。
[0059]
通过上传操作去除无线和重复数据,并剔除换台等无效行为数据(观看时长2分钟以内算无效观看),得到有效的用户观看历史数据。
[0060]
步骤s200通过对用户观看时长进行归一化处理,可对用户观看时长进行标准化处理,消除不同特征之间的相关性,以消除量纲的影响评分,并对不同的用户观看时长设定不
同分数,标准化后的用户观看时长分数处于0-5分内。
[0061]
步骤s300对于每个用户,设定至少一个标签,标签类别如喜剧、动作、恐怖等,并未为每个节目的每个标签设定一个赋分权重。通过该方法对用户喜好的节目进行人工干预,设定节目类型的赋分权重,在评分结束后进行二次处理。赋分权重为0-10,赋值0后不推荐该类型的节目,赋值1不会对推荐产生影响,赋值大于1时,会增加推荐的分值,用户更容易被推荐该类型的节目。
[0062]
步骤s400针对用户对节目的评分进行计算,每个用户对每个节目的评分标记为s2,计算公式如下:
[0063][0064]
其中,s2为二次评分分数,s1为一次评分分数,n为该影片的标签总个数,cn为第n个被干预标签的干预指数,未被干预的标签干预指数默认值为1。
[0065]
步骤s500为用户推荐节目,该步骤执行如下操作:
[0066]
(1)基于物品协同过滤方法构建推荐模型,所述推荐模型用于基于用户终端id、节目id以及每个用户对每个节目的评分为用户推荐播单;
[0067]
(2)基于用户终端id、节目id以及每个用户对每个节目的评分构建样本数据,基于样本数据对推荐模型进行训练,得到训练后推荐模型;
[0068]
(3)对于每个用户,基于训练后推荐模型为用户推荐播单。
[0069]
实施例2:
[0070]
本发明一种电视节目单推荐系统,包括数据采集模块、时长打分模块、节目赋分模块、节目打分模块以及播单推荐模块,该系统可执行实施例1公开的方法。
[0071]
数据采集模块用于采集多个用户的用户观看历史数据,并对用户观看历史数据进行数据清洗,得到预处理后用户观看历史数据,用户观看历史数据包括用户终端id、频道id、节目id和用户观看时长,所述用户观看时长包括直播模式下每个频道的观看时长以及回播模式下每个节目的观看时长。
[0072]
本实施例中用户终端id包括设备id和机顶盒id,以设备id和机顶盒id区分用户。
[0073]
数据采集模块用于执行如下对用户观看历史数据进行数据清洗,包括如下步骤:
[0074]
(1)去除用户终端id、频道id或节目id为空的用户观看历史数据;
[0075]
(2)去除用户观看历史数据中重复的数据;
[0076]
(3)去除小于预定时间的用户观看时长以及对应的用户终端id以及节目id或频道id。
[0077]
通过上传操作去除无线和重复数据,并剔除换台等无效行为数据(观看时长2分钟以内算无效观看),得到有效的用户观看历史数据。
[0078]
时长打分模块用于对用户观看时长进行归一化处理,并对用户观看时长进行打分,每个观看时长对应一个分数,得到用户观看时长分数。
[0079]
本实施例中时长打分模块用于通过对用户观看时长进行归一化处理,可对用户观看时长进行标准化处理,消除不同特征之间的相关性,以消除量纲的影响评分,并对不同的用户观看时长设定不同分数,标准化后的用户观看时长分数处于0-5分内。
[0080]
对于每个节目,节目赋分模块用于为每个节目设定至少一个标签,并基于用户观
看时长设定每个标签的赋分权重,得到每个节目在每个标签下的赋分权重。
[0081]
对于每个用户,通过节目赋分模块设定至少一个标签,标签类别如喜剧、动作、恐怖等,并未为每个节目的每个标签设定一个赋分权重。通过该模块对用户喜好的节目进行人工干预,设定节目类型的赋分权重,在评分结束后进行二次处理。赋分权重为0-10,赋值0后不推荐该类型的节目,赋值1不会对推荐产生影响,赋值大于1时,会增加推荐的分值,用户更容易被推荐该类型的节目。
[0082]
节目打分模块用于基于用户观看时长分数以及每个节目在每个标签下的赋分权重,计算每个用户对每个节目的评分。
[0083]
本实施例中,节目打分模块用于针对用户对节目的评分进行计算,每个用户对每个节目的评分标记为s2,计算公式如下:
[0084][0085]
其中,s2为二次评分分数,s1为一次评分分数,n为该影片的标签总个数,cn为第n个被干预标签的干预指数,未被干预的标签干预指数默认值为1。
[0086]
播单推荐模块用于基于每个用户对每个节目的评分,为每个用户推荐播单。
[0087]
本实施例播单推荐模块用于为用户推荐节目,作为具体实实施,该模块用于执行如下操作:
[0088]
(1)基于物品协同过滤方法构建推荐模型,所述推荐模型用于基于用户终端id、节目id以及每个用户对每个节目的评分为用户推荐播单;
[0089]
(2)基于用户终端id、节目id以及每个用户对每个节目的评分构建样本数据,基于样本数据对推荐模型进行训练,得到训练后推荐模型;
[0090]
(3)对于每个用户,基于训练后推荐模型为用户推荐播单。
[0091]
上文通过附图和优选实施例对本发明进行了详细展示和说明,然而本发明不限于这些已揭示的实施例,基与上述多个实施例本领域技术人员可以知晓,可以组合上述不同实施例中的手段得到本发明更多的实施例,这些实施例也在本发明的保护范围之内。
技术特征:
1.一种电视节目单推荐方法,其特征在于,包括如下步骤:采集多个用户的用户观看历史数据,并对用户观看历史数据进行数据清洗,得到预处理后用户观看历史数据,所述用户观看历史数据包括用户终端id、频道id、节目id和用户观看时长,所述用户观看时长包括直播模式下每个频道的观看时长以及回播模式下每个节目的观看时长;对用户观看时长进行归一化处理,并对用户观看时长进行打分,每个观看时长对应一个分数,得到用户观看时长分数;对于每个节目,为每个节目设定至少一个标签,并基于用户观看时长设定每个标签的赋分权重,得到每个节目在每个标签下的赋分权重;基于用户观看时长分数以及每个节目在每个标签下的赋分权重,计算每个用户对每个节目的评分;基于每个用户对每个节目的评分,为每个用户推荐播单。2.根据权利要求1所述的电视节目单推荐方法,其特征在于,所述用户终端id包括设备id和机顶盒id。3.根据权利要求1所述的电视节目单推荐方法,其特征在于,对用户观看历史数据进行数据清洗,包括如下步骤:去除用户终端id、频道id或节目id为空的用户观看历史数据;去除用户观看历史数据中重复的数据;去除小于预定时间的用户观看时长以及对应的用户终端id以及节目id或频道id。4.根据权利要求1所述的电视节目单推荐方法,其特征在于,每个用户对每个节目的评分标记为s2,计算公式如下:其中,s2为二次评分分数,s1为一次评分分数,n为该影片的标签总个数,cn为第n个被干预标签的干预指数,未被干预的标签干预指数默认值为1。5.根据权利要求1所述的电视节目单推荐方法,其特征在于,基于物品协同过滤方法构建推荐模型,所述推荐模型用于基于用户终端id、节目id以及每个用户对每个节目的评分为用户推荐播单;基于用户终端id、节目id以及每个用户对每个节目的评分构建样本数据,基于样本数据对推荐模型进行训练,得到训练后推荐模型;对于每个用户,基于训练后推荐模型为用户推荐播单。6.一种电视节目单推荐系统,其特征在于,通过如权利要求1-5任一项所述的一种电视节目单推荐方法为用户推荐节目播单,所述系统包括:数据采集模块,所述数据采集模块用于采集多个用户的用户观看历史数据,并对用户观看历史数据进行数据清洗,得到预处理后用户观看历史数据,所述用户观看历史数据包括用户终端id、频道id、节目id和用户观看时长,所述用户观看时长包括直播模式下每个频道的观看时长以及回播模式下每个节目的观看时长;时长打分模块,所述时长打分模块用于对用户观看时长进行归一化处理,并对用户观看时长进行打分,每个观看时长对应一个分数,得到用户观看时长分数;
节目赋分模块,对于每个节目,所述节目赋分模块用于为每个节目设定至少一个标签,并基于用户观看时长设定每个标签的赋分权重,得到每个节目在每个标签下的赋分权重;节目打分模块,所述节目打分模块用于基于用户观看时长分数以及每个节目在每个标签下的赋分权重,计算每个用户对每个节目的评分;播单推荐模块,所述播单推荐模块用于基于每个用户对每个节目的评分,为每个用户推荐播单。7.根据权利要求6所述的电视节目单推荐系统,其特征在于,所述用户终端id包括设备id和机顶盒id。8.根据权利要求6所述的电视节目单推荐系统,其特征在于,所述数据采集模块用于执行如下对用户观看历史数据进行数据清洗:去除用户终端id、频道id或节目id为空的用户观看历史数据;去除用户观看历史数据中重复的数据;去除小于预定时间的用户观看时长以及对应的用户终端id以及节目id或频道id。9.根据权利要求6所述的电视节目单推荐系统,其特征在于,每个用户对每个节目的评分标记为s2,计算公式如下:其中,s2为二次评分分数,s1为一次评分分数,n为该影片的标签总个数,cn为第n个被干预标签的干预指数,未被干预的标签干预指数默认值为1。10.根据权利要求6所述的电视节目单推荐系统,其特征在于,所述播单推荐模块用于执行如下:基于物品协同过滤方法构建推荐模型,所述推荐模型用于基于用户终端id、节目id以及每个用户对每个节目的评分为用户推荐播单;基于用户终端id、节目id以及每个用户对每个节目的评分构建样本数据,基于样本数据对推荐模型进行训练,得到训练后推荐模型;对于每个用户,基于训练后推荐模型为用户推荐播单。
技术总结
本发明公开了电视节目单推荐方法及系统,属于大数据处理技术领域,要解决的技术问题为如何高效精确的为用户推荐播单。包括如下步骤:采集多个用户的用户观看历史数据,并对用户观看历史数据进行数据清洗,用户观看历史数据包括用户终端ID、频道ID、节目ID和用户观看时长;对用户观看时长进行归一化处理,并对用户观看时长进行打分,每个观看时长对应一个分数;为每个节目设定至少一个标签,并基于用户观看时长设定每个标签的赋分权重,得到每个节目在每个标签下的赋分权重;基于用户观看时长分数以及每个节目在每个标签下的赋分权重,计算每个用户对每个节目的评分;基于每个用户对每个节目的评分,为每个用户推荐播单。为每个用户推荐播单。为每个用户推荐播单。
技术研发人员:杜浩 刘旭 孟凡栋 王敏 李小敏 宋双 雷俊伟 丛锐 王志亮
受保护的技术使用者:山东浪潮超高清智能科技有限公司
技术研发日:2023.06.14
技术公布日:2023/8/31
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/