一种基于聚类算法改进的采暖方式混合推荐方法与流程
未命名
10-08
阅读:134
评论:0

1.本发明属于电力行业电能替代领域,尤其涉及一种基于聚类算法改进的采暖方式混合推荐方法。
背景技术:
2.随着社会和经济的发展,人们对生活品质提升的需求越来越强烈,采暖系统是提升人们生活品质的重要手段,如何为用户推送合适的采暖方式是提高用户对公司粘性和提升用户满意度的有效方式,然而电采暖方案较多,且每个电采暖方案涉及客户偏好、产品特性、成本等多方面。当用户需要选择采暖方式时,没有任何经验,靠上网查询相关资料获取信息,会出现大量的同一商品供用户选择,这时用户可能会遇到选择难的问题。
3.如何在大量数据中找到用户需要的信息,这是一个难题。为了解决这个问题,已经有很多人提出了基于各种技术的推荐算法,给用户推荐采暖方案,如协同过滤算法。传统的协同过滤算法存在推荐精度不高,数据稀疏,冷启动等问题,使得该算法在应用过程中难以做到准确推荐。现有的推荐算法大多数从过滤用户或者产品的角度进行推荐,或者仅仅从优质采暖方式的属性特点出发进行推荐,这种把用户对产品、属性的偏好程度分裂开进行推荐的方式,容易降低采暖方式推荐的准确性。
4.现有技术中的混合推荐方法,综合考虑了基于内容推荐和协同过滤推荐,解决了基于内容推荐难以实现对自己未知的采暖方式推荐的问题,同时解决了协同过滤推荐冷启动的问题,但是该技术在获取用户邻居时需要与全量用户进行计算,且没有考虑采用同一类方案的用户之间仍然存在差异性,造成推荐的不准确,缺乏针对性。
技术实现要素:
5.本发明目的在于提供一种基于聚类算法改进的采暖方式混合推荐方法,以解决现有技术难以及时准确地挖掘用户的采暖偏好的技术问题。
6.为实现上述目的,本发明的基于聚类算法改进的采暖方式混合推荐方法的具体技术方案如下:第一方面,提供一种基于聚类算法改进的采暖方式混合推荐方法,包括:建立用于用户采暖方式推荐的混合推荐模型。其中,混合推荐模型包括:基于内容推荐算法和基于聚类算法改进的协同过滤推荐算法。
7.所述建立用于用户采暖方式推荐的混合推荐模型的步骤,包括:将获取到的用户基础信息特性、偏好特征、行为记录特征,构建用户特征画像,将采暖方案建设成本、运行成本、稳定性、便捷性、环保性、供热性能、安全性、场所限制等数据,构建采暖方式特征画像。
8.将采暖方式特征画像和用户特征画像,利用余弦相似度算法进行相似度计算得到不同采暖方式的相似度得分。
9.根据基于内容推荐思想,得到不同用户采暖方式推荐列表。
10.根据当前所有已采暖方案的用户,选择k-means聚类算法进行用户群体聚类,得到具体某种采暖方式下的k类群体。
11.根据聚类群体的聚类中心计算,得到某采暖方式下的聚类中心用户。
12.将所述用户特征画像与聚类中心用户进行矩阵相似性计算,得到不同用户之间的相似程度,形成用户邻居矩阵。
13.结合皮尔逊相关系数和余弦相似度算法的优点,形成改进相似性的计算方法,用户邻居矩阵计算。
14.基于用户邻居矩阵前n个邻居,取采暖方式特征画像矩阵子集,形成邻居用户采暖方式特征画像。
15.将邻居矩阵和邻居用户采暖方式特征矩阵,利用余改进相似性的计算方法计算得到用户对不同采暖方式的相似度得分。
16.根据基于用户的协同过滤推荐思想,得到不同用户采暖方式推荐列表。
17.根据基于内容推荐得到的采暖方式列表和基于用户的协同过滤推荐得到的采暖方式列表,通过交集计算方式,得到基于混合推荐算法的排名前n的top-n采暖方式推荐列表。
18.第二方面,提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序指令;所述计算机程序指令被处理器执行时实现如第一方面实施例所述的用户采暖方案推荐方法。
19.本发明的基于聚类算法改进的采暖方式混合推荐方法具有以下优点:本发明采用基于内容推荐算法、基于用户的协同过滤推进算法,并通过两类算法结果的集合,可高效准确地挖掘不同用户采暖方式偏好推荐准确性的问题,提升采暖推广的效率、减轻人员压力。
20.(1)用户相似度评价方法的改进:在协同过滤算法中,一般利用皮尔逊相关系数作为相似度的衡量标准,本发明结合皮尔逊相关系数和余弦相似度改进相似性的计算方法。可以尽可能的适应各种特征。
21.(2)根据用户的实际采暖需求设计用户特征指标体系,构建用户特征画像,形成评分矩阵,评分更加符合用户需求。
附图说明
22.图1为本发明基于聚类算法改进的采暖方式混合推荐方法的分析路径示意图。
23.图2为本发明基于聚类算法改进的采暖方式混合推荐方法的用户采暖方式混合推荐模型设定步骤。
具体实施方式
24.为了更好地了解本发明的目的、结构及功能,下面结合附图,对本发明一种基于聚类算法改进的采暖方式混合推荐方法做进一步详细的描述。
25.本发明实施例的方法包括如下的步骤:步骤s1:建立用于用户采暖方式推荐的混合推荐模型。
26.其中,混合推荐模型包括:基于内容推荐算法和基于聚类算法改进的协同过滤推荐算法。
27.一、基于内容推荐算法的采暖方式推荐区别于互联网行业推荐算法中,资源内容存在海量的特性,用户采暖方式的类别及特征可控,基于此,本发明实施例提出基于内容推荐算法用于采暖方式推荐。
28.步骤1:用户特征画像构建(1)用户基础信息特征用户在登陆、注册时提供的关于自身相关的信息,包括用户的类型、用户属性、用户特征、采暖场所、建筑特性、采暖需求(采暖时长、采暖天数、舒适温度等)。
29.(2)用户偏好特征用户采暖方式偏好(成本偏好、效果偏好等),偏好的采暖功能及特性,历史采用的采暖方式等信息。
30.(3)用户行为记录特征将用户历史操作过的标的物作为用户的特征表示,如在市面上现有的app或公众号设置的采暖推荐页面,或通过电力系统的服务热线进行的内容咨询等渠道,搜集用户采暖方式的关注度;通过上述画像构建,得到用户特征用向量u。
[0031][0032]
步骤2:采暖方式特征画像构建从建设成本、运行成本、稳定性、便捷性、环保性、供热性能、安全性、场所限制等维度,构建采暖方式特征画像,得到采暖方式特征画像矩阵i。
[0033][0034]
式中,表示第k个采暖方式第j个属性的得分情况,k=1,2,...,n,j=1,2,...,m。
[0035]
步骤3:基于内容推荐算法余弦相似性是通过测量两个向量的夹角的余弦值来度量它们之间的相似性,用向量空间中两个向量夹角的余弦值作为衡量两个个体间差异的大小。余弦值越接近1,就表明夹角越接近0度,也就是两个向量越相似。
[0036]
在基于内容的推荐方法中,余弦相似度由于其效果准确,已经被证实是一种标准的度量体系。通过相似性度量方法,得到的用户特征画像和采暖方式特征画像矩阵是非常稀疏的,即每个用户只使用了标签集合中的一小部分的标签,余弦相似性度量在数据较为稀疏的情况更为实用,因此本发明采用余弦相似性来计算用户矩阵和采暖方式矩阵的相似性。
[0037][0038]
式中u,i分别是用户特征向量和采暖方式特征画像矩阵。
[0039]
基于上式计算,并进行得分排序,得到用户偏好的采暖方式集合。
[0040]
二、基于聚类算法改进的协同过滤推荐算法基于用户的协同过滤推荐过程:要给用户u推荐其感兴趣采暖方式,首先根据其用户特征画像找到与当前用户有相似偏好的其他用户,这些其他用户即邻居用户或最近邻,然后根据邻居的采暖方式偏好给用户u推荐其可能感兴趣的采暖方式。
[0041]
步骤一:已采暖用户特征聚类(1)以某采暖方式下全量用户的画像矩阵为输入样本集;(2)利用密度函数计算输入样本集中的各样本点的分布密度,其中密度函数满足如下关系式:
[0042]
式中,为第i个样本点的分布密度,为不同样本点和之间的欧式距离,n为样本点的数量;(3)对计算得到的各样本点的分布密度进行降序排序,选出排列在前个的样本点作为初始聚类中心;(4)利用手肘法确定聚类簇数量k;(5)基于k 均值聚类算法(k-means clustering)进行聚类,得到个聚类簇;(6)计算任意两个聚类簇之间的距离,并将距离按照升序排列;(7)若》k,则将距离最小的两个聚类簇进行合并,形成新聚类簇,以均值法计算新聚类簇的聚类中心,并返回步骤(5)再次进行聚类;若≤k,则结束聚类,以当前的聚类簇为用户簇。
[0043]
(8)通过加权平均得到聚类中心用户;步骤二:用户邻居矩阵构建在协同过滤算法中,一般利用皮尔逊相关系数作为相似度的衡量标准,本发明结合皮尔逊相关系数和余弦相似度改进相似性的计算方法。数学表达式如下:
[0044]
其中,表示用户u与用户v之间的相似度;表示用户u对方案i的评分,表示用户v对方案i的评分;表示用户u与用户v的共同评分方案集合;表示项目i的
平均评分;、表示用户u与用户v对所有存在评分方案的均值。
[0045][0046]
式中,u-u是用户相似性计算结果,矩阵元素表示用户和用户的相似性结果,即=,该矩阵为对称矩阵,矩阵元素计算结果越高表示用户越相似。
[0047]
步骤三:基于用户的协同过滤推荐基于用户的邻居矩阵,将邻居偏好的采暖方式推荐给用户。通过上述计算,可以得到用户的相似邻居,如下:
[0048]
式中,表示的前k个邻居,表示与邻居的相似程度。
[0049]
对应邻居的偏好采暖方式可表示为矩阵 :
[0050]
式中,表示的前k个邻居的偏好产品,表示对产品的喜欢程度。
[0051]
步骤四:推荐列表生成为了产生更准确结果,本发明在产生推荐列表时,综合考虑邻居的相似程度以及邻居对采暖方式的偏好程度,通过用户的邻居矩阵和邻居用户偏好资源进行加权平均,得到用户的偏好产品矩阵u-i,并形成产品推荐结果。
[0052]
式中,表示给用户推荐的采暖方式列表,表示采暖方式推荐的优先等级数值。
[0053]
步骤s2:构建融合基于内容推荐和基于用户协同过滤推荐的混合推荐算法,得到top-n推荐列表,见图2。
[0054]
基于内容推荐只考虑了用户本身的信息,没有涉及其他的邻居用户,出现了过于局限性的问题,即用户喜欢某种自己未知的采暖方式。
[0055]
协同过滤推荐可以帮助用户发现潜在的但未察觉的偏好,但是仍然存在一些弊
端,例如,它依赖用户对物品的评分,没有涉及到物品本身的属性。事实上,用户一般只会评价较少部分物品,从而造成评分矩阵的稀疏性问题。此外,还存在冷启动问题,即新用户还没有任何评分时如何推荐。
[0056]
本发明采用基于内容和协同过滤的混合推荐算法,同时将聚类算法改进协同过滤算法,来实现用户采暖方式的推荐,能够规避单一算法的弊端,融合其各自优势,精准挖掘用户需求,进而产生有针对性的高质量推荐结果。
[0057]
可以理解,本发明是通过一些实施例进行描述的,本领域技术人员知悉的,在不脱离本发明的精神和范围的情况下,可以对这些特征和实施例进行各种改变或等效替换。另外,在本发明的教导下,可以对这些特征和实施例进行修改以适应具体的情况及材料而不会脱离本发明的精神和范围。因此,本发明不受此处所公开的具体实施例的限制,所有落入本技术的权利要求范围内的实施例都属于本发明所保护的范围内。
技术特征:
1.一种基于聚类算法改进的采暖方式混合推荐方法,其特征在于,包括以下步骤:步骤s1、建立用于用户采暖方式推荐的混合推荐模型,所述混合推荐模型包括基于内容推荐算法和基于聚类算法改进的协同过滤推荐算法;步骤s1-1、基于内容推荐算法的采暖方式推荐:将获取到的用户基础信息特性、偏好特征、行为记录特征,构建用户特征画像,将获取到的采暖方案建设成本、运行成本、稳定性、便捷性、环保性、供热性能、安全性和场所限制数据,构建采暖方式特征画像;将采暖方式特征画像和用户特征画像,利用余弦相似度算法进行相似度计算得到不同采暖方式的相似度得分;步骤s1-2、基于聚类算法改进的协同过滤推荐算法:当要给用户u推荐其感兴趣采暖方式,首先根据用户特征画像找到与当前用户有相似偏好的其他用户,这些其他用户即邻居用户或最近邻,然后根据邻居的采暖方式偏好给用户u推荐其可能感兴趣的采暖方式;步骤s2、构建融合基于内容推荐和基于用户协同过滤推荐的混合推荐算法,得到排名前n的top-n推荐列表。2.根据权利要求1所述的基于聚类算法改进的采暖方式混合推荐方法,其特征在于,所述步骤s1-1具体包括以下步骤:步骤s1-1-1、用户特征画像构建步骤s1-1-1-1、用户基础信息特征用户在登陆、注册时提供的关于自身相关的信息,包括用户的类型、用户属性、用户特征、采暖场所、建筑特性和采暖需求;步骤s1-1-1-2、用户偏好特征用户采暖方式偏好,偏好的采暖功能及特性和历史采用的采暖方式信息;步骤s1-1-1-3、用户行为记录特征将用户历史操作过的标的物作为用户的特征表示;通过用户特征画像构建,得到用户特征用向量u:
ꢀꢀ
(1)步骤s1-1-2、采暖方式特征画像构建从建设成本、运行成本、稳定性、便捷性、环保性、供热性能、安全性和场所限制维度,构建采暖方式特征画像,得到采暖方式特征画像矩阵i:
ꢀꢀꢀ
(2)式中,表示第k个采暖方式第j个属性的得分情况,k=1,2,...,n,j=1,2,...,m;步骤s1-1-3、基于内容推荐算法采用余弦相似性来计算用户矩阵和采暖方式矩阵的相似性:
ꢀꢀꢀ
(3)式中u,i分别是用户特征向量和采暖方式特征画像矩阵;基于式(3)计算,并进行得分排序,得到用户偏好的采暖方式集合。3.根据权利要求1所述的基于聚类算法改进的采暖方式混合推荐方法,其特征在于,所述步骤s1-2包括以下步骤:步骤s1-2-1、已采暖用户特征聚类:根据基于内容推荐思想,得到不同用户采暖方式推荐列表;根据当前所有已采暖方案的用户,选择k-means聚类算法进行用户群体聚类,得到具体某种采暖方式下的k类群体;根据聚类群体的聚类中心计算,得到某采暖方式下的聚类中心用户;步骤s1-2-2、用户邻居矩阵构建:结合皮尔逊相关系数和余弦相似度算法,将所述用户特征画像与聚类中心用户进行矩阵相似性计算,得到不同用户之间的相似程度,形成用户邻居矩阵;步骤s1-2-3、基于用户的协同过滤推荐:基于用户的邻居矩阵,将邻居偏好的采暖方式推荐给用户,得到用户的相似邻居,如式(4):
ꢀꢀꢀ
(4)式中,表示的前k个邻居,表示与邻居的相似程度;对应邻居的偏好采暖方式可表示为矩阵 :
ꢀꢀꢀ
(5)式中,表示的前k个邻居的偏好产品,表示对产品的喜欢程度;步骤s1-2-4、推荐列表生成:综合考虑邻居的相似程度以及邻居对采暖方式的偏好程度,通过用户的邻居矩阵和邻居用户偏好资源进行加权平均,得到用户的偏好产品矩阵u-i,并形成产品推荐结果:
ꢀꢀꢀꢀ
(6)式中,表示给用户推荐的采暖方式列表,表示采暖方式推荐的优先等级数值。4.根据权利要求3所述的基于聚类算法改进的采暖方式混合推荐方法,其特征在于,所
述步骤s1-2-1包括以下步骤:步骤s1-2-1-1、以某采暖方式下全量用户的画像矩阵为输入样本集;步骤s1-2-1-2、利用密度函数计算输入样本集中的各样本点的分布密度,其中密度函数满足式(7):
ꢀꢀꢀ
(7)式中,为第i个样本点的分布密度,为不同样本点和之间的欧式距离,n为样本点的数量;步骤s1-2-1-3、对计算得到的各样本点的分布密度进行降序排序,选出排列在前个的样本点作为初始聚类中心;步骤s1-2-1-4、利用手肘法确定聚类簇数量k;步骤s1-2-1-5、基于k 均值聚类算法进行聚类,得到个聚类簇;步骤s1-2-1-6、计算任意两个聚类簇之间的距离,并将距离按照升序排列;步骤s1-2-1-7、若>k,则将距离最小的两个聚类簇进行合并,形成新聚类簇,以均值法计算新聚类簇的聚类中心,并返回步骤s1-2-1-5再次进行聚类;若≤k,则结束聚类,以当前的聚类簇为用户簇;步骤s1-2-1-8、通过加权平均得到聚类中心用户。5.根据权利要求3所述的基于聚类算法改进的采暖方式混合推荐方法,其特征在于,所述步骤s1-2-2、用户邻居矩阵构建:采用结合皮尔逊相关系数和余弦相似度改进相似性的计算方法,数学表达式如式(8): (8)其中,表示用户u与用户v之间的相似度;表示用户u对方案i的评分,表示用户v对方案i的评分;表示用户u与用户v的共同评分方案集合;表示项目i的平均评分;、表示用户u与用户v对所有存在评分方案的均值;
ꢀꢀ
(9)式中,u-u是用户相似性计算结果,矩阵元素表示用户和用户的相似性结果,即=,该矩阵为对称矩阵,矩阵元素计算结果越高表示用户越相似。
技术总结
本发明公开一种基于聚类算法改进的采暖方式混合推荐方法,属于电力行业电能替代领域。基于内容推荐算法将构建的用户特征画像和采暖方式特征画像的实际矩阵值输入基于内容推荐算法;基于聚类算法改进的协同过滤推荐算法,选择k-means聚类算法进行用户群体聚类,得到具体某种采暖方式下的K类群体,将用户特征画像与聚类中心用户进行矩阵相似性计算,形成用户邻居矩阵,将构建的用户邻居矩阵和邻居偏好的采暖方式矩阵实际值输入基于用户的改进协同过滤推荐算法,分别输出各自推荐列表后,综合排序得到TOP-N推荐结果。本发明能够规避单一算法的弊端,融合推荐算法各自优势,精准挖掘用户需求,进而产生有针对性的高质量推荐结果。结果。结果。
技术研发人员:王珏昕 刘志刚 高振铎 张金昌 车明玉 李国华 赵阳 张泽宇 宋雯 季帅 刘帅 杨怡楠 霍明连 王明慧
受保护的技术使用者:国网吉林省电力有限公司长春供电公司
技术研发日:2023.08.31
技术公布日:2023/10/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/