基于直播大数据的用户分析方法及系统与流程
未命名
10-19
阅读:62
评论:0
1.本发明涉及计算机数据处理技术领域,特别涉及基于直播大数据的用户分析方法及系统。
背景技术:
2.目前,随着直播行业的日趋发展,直播软件越趋流行,观看直播的用户越来越多。为了便于直播软件进行优化,需要定时对观看直播的用户进行用户分析,比如:分析用户观看直播的内容偏好,在直播软件中对应的直播内容版块增设直播人员,以满足内容偏好。在进行用户分析时,往往需要基于直播大数据进行,比如:收集大量的各个直播软件的用户观看直播的观看内容历史,基于该观看内容历史分析用户观看直播的内容偏好。
3.但是,直播大数据的获取往往是基于大数据技术实现,获取的直播大数据中可能会存在不可信的数据,比如:来源不可靠的数据等,若直接采纳用作用户分析,可能会导致用户分析误差,从而导致直播软件优化不精准。
4.因此,亟需一种解决办法。
技术实现要素:
5.本发明目的之一在于提供了基于直播大数据的用户分析方法,在对观看直播的用户进行用户分析时,基于从直播大数据中提取出的可信数据进行用户分析,避免直播大数据中可能会存在不可信的数据导致用户分析误差的问题发生,提升了直播软件优化的精准性。
6.本发明实施例提供的基于直播大数据的用户分析方法,包括:
7.搜罗直播大数据;
8.对直播大数据进行可信数据提取,获得可信数据;
9.获取用户分析任务;
10.基于用户分析任务,生成数据分析模板;
11.基于数据分析模板,根据可信数据进行用户分析,获得用户分析结果。
12.优选的,对直播大数据进行可信数据提取,获得可信数据,包括:
13.解析直播大数据中的多个数据项;
14.获取数据项的来源途径的途径类型,途径类型包括:主动途径和被动途径;
15.当途径类型为主动途径时,分别获取数据项的数据信息和来源途径的途径信息;
16.基于预设的第一可信量化模板,对数据信息和途径信息进行可信量化,获得第一可信值;
17.当第一可信值大于等于预设的第一可信阈值时,将数据项作为可信数据;
18.当途径类型为被动途径时,分别获取来源途径的信用信息和来源途径对数据项进行可信担保的担保信息;
19.基于预设的第二可信量化模板,对信用信息和担保信息进行可信量化,获得第二
可信值;
20.当第二可信值大于等于预设的第二可信阈值时,将数据项作为可信数据。
21.优选的,获取用户分析任务,包括:
22.获取工作人员输入的用户分析任务;
23.和/或,
24.交互式获取工作人员的用户分析需求;
25.基于用户分析需求,确定用户分析任务。
26.优选的,交互式获取工作人员的用户分析需求,包括:
27.获取工作人员对应的预设的权限场景库;
28.获取工作人员最近预设的时间内在权限场景库中的任一权限场景中产生的产生操作及对应的操作产生时间;
29.基于操作产生时间,将产生操作设置于预设的时间轴线上;
30.基于产生操作簇约束条件,从时间轴线上确定产生操作簇;
31.从预设的用户分析需求预测库中确定产生操作簇对应的预测需求;
32.基于预测需求,生成用户分析需求选择列表,并进行输出显示;
33.接收工作人员从用户分析需求选择列表中挑选的预测需求,并作为用户分析需求;
34.其中,产生操作簇约束条件包括:
35.产生操作簇由时间轴线上连续n个产生操作组成;n为大于等于2的整数;
36.产生操作簇中的相邻产生操作之间的操作产生时间差小于等于预设的时间差阈值;
37.产生操作簇中的产生操作产生于的权限场景两两之间的场景关系与预设的标准场景关系库中的一个标准场景关系与匹配。
38.优选的,基于用户分析任务,生成数据分析模板,包括:
39.基于预设的特征提取模板,对用户分析任务进行特征提取,获得多个任务特征;
40.基于任务特征,构建用户分析任务的特征描述向量;
41.从预设的数据分析规则库中确定特征描述向量对应的至少一个第一数据分析规则;
42.从工作人员对应的预设的偏好数据分析规则库中确定特征描述向量对应的至少一个第二数据分析规则;
43.基于互补处理规则,对第一数据分析规则和第二数据分析规则进行互补处理,获得多个第三数据分析规则;
44.基于第三数据分析规则,生成数据分析模板;
45.其中,互补处理规则包括:
46.当第一数据分析规则和第二数据分析规则中各自存在一个同类型数据分析规则时,分别获取同类型数据分析规则对应的预设的普适偏好值以及工作人员对同类型数据分析规则偏好的个性偏好值;
47.当个性偏好值大于等于预设的个性偏好阈值和/或个性偏好值大于普适偏好值的差值大于等于预设的差值阈值时,从第一数据分析规则中剔除同类型数据分析规则;
48.将剩余的第一数据分析规则和第二数据分析规则作为第三数据分析规则。
49.本发明实施例提供的基于直播大数据的用户分析系统,其特征在于,包括:
50.直播大数据搜罗模块,用于搜罗直播大数据;
51.可信数据提取模块,用于对直播大数据进行可信数据提取,获得可信数据;
52.用户分析任务获取模块,用于获取用户分析任务;
53.数据分析模板生成模块,用于基于用户分析任务,生成数据分析模板;
54.用户分析模块,用于基于数据分析模板,根据可信数据进行用户分析,获得用户分析结果。
55.优选的,可信数据提取模块对直播大数据进行可信数据提取,获得可信数据,包括:
56.解析直播大数据中的多个数据项;
57.获取数据项的来源途径的途径类型,途径类型包括:主动途径和被动途径;
58.当途径类型为主动途径时,分别获取数据项的数据信息和来源途径的途径信息;
59.基于预设的第一可信量化模板,对数据信息和途径信息进行可信量化,获得第一可信值;
60.当第一可信值大于等于预设的第一可信阈值时,将数据项作为可信数据;
61.当途径类型为被动途径时,分别获取来源途径的信用信息和来源途径对数据项进行可信担保的担保信息;
62.基于预设的第二可信量化模板,对信用信息和担保信息进行可信量化,获得第二可信值;
63.当第二可信值大于等于预设的第二可信阈值时,将数据项作为可信数据。
64.优选的,用户分析任务获取模块获取用户分析任务,包括:
65.获取工作人员输入的用户分析任务;
66.和/或,
67.交互式获取工作人员的用户分析需求;
68.基于用户分析需求,确定用户分析任务。
69.优选的,用户分析任务获取模块交互式获取工作人员的用户分析需求,包括:
70.获取工作人员对应的预设的权限场景库;
71.获取工作人员最近预设的时间内在权限场景库中的任一权限场景中产生的产生操作及对应的操作产生时间;
72.基于操作产生时间,将产生操作设置于预设的时间轴线上;
73.基于产生操作簇约束条件,从时间轴线上确定产生操作簇;
74.从预设的用户分析需求预测库中确定产生操作簇对应的预测需求;
75.基于预测需求,生成用户分析需求选择列表,并进行输出显示;
76.接收工作人员从用户分析需求选择列表中挑选的预测需求,并作为用户分析需求;
77.其中,产生操作簇约束条件包括:
78.产生操作簇由时间轴线上连续n个产生操作组成;n为大于等于2的整数;
79.产生操作簇中的相邻产生操作之间的操作产生时间差小于等于预设的时间差阈
值;
80.产生操作簇中的产生操作产生于的权限场景两两之间的场景关系与预设的标准场景关系库中的一个标准场景关系与匹配。
81.优选的,数据分析模板生成模块基于用户分析任务,生成数据分析模板,包括:
82.基于预设的特征提取模板,对用户分析任务进行特征提取,获得多个任务特征;
83.基于任务特征,构建用户分析任务的特征描述向量;
84.从预设的数据分析规则库中确定特征描述向量对应的至少一个第一数据分析规则;
85.从工作人员对应的预设的偏好数据分析规则库中确定特征描述向量对应的至少一个第二数据分析规则;
86.基于互补处理规则,对第一数据分析规则和第二数据分析规则进行互补处理,获得多个第三数据分析规则;
87.基于第三数据分析规则,生成数据分析模板;
88.其中,互补处理规则包括:
89.当第一数据分析规则和第二数据分析规则中各自存在一个同类型数据分析规则时,分别获取同类型数据分析规则对应的预设的普适偏好值以及工作人员对同类型数据分析规则偏好的个性偏好值;
90.当个性偏好值大于等于预设的个性偏好阈值和/或个性偏好值大于普适偏好值的差值大于等于预设的差值阈值时,从第一数据分析规则中剔除同类型数据分析规则;
91.将剩余的第一数据分析规则和第二数据分析规则作为第三数据分析规则。
92.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
93.下面通过附图和实施例,对本发明的技术方案做进一步的详细描述。
附图说明
94.附图用来提供对本发明的进一步理解,并且构成说明书的一部分,与本发明的实施例一起用于解释本发明,并不构成对本发明的限制。在附图中:
95.图1为本发明实施例中基于直播大数据的用户分析方法的示意图;
96.图2为本发明实施例中基于直播大数据的用户分析系统的示意图。
具体实施方式
97.以下结合附图对本发明的优选实施例进行说明,应当理解,此处所描述的优选实施例仅用于说明和解释本发明,并不用于限定本发明。
98.本发明实施例提供了基于直播大数据的用户分析方法,如图1所示,包括:
99.步骤s1:搜罗直播大数据;其中,直播大数据包括:大量的各个直播软件与观看直播的用户相关的数据,具体的,比如:用户观看直播的观看内容历史、用户观看直播的发表弹幕历史、用户观看直播的打赏历史、直播软件内各直播内容版块(比如:游戏版块、娱乐版块、科技版块等)的历史人气排行等;
100.步骤s2:对直播大数据进行可信数据提取,获得可信数据;其中,可信数据为直播大数据中可信的数据;
101.步骤s3:获取用户分析任务;其中,用户分析任务包括:需要进行用户分析的任务,具体的,比如:分析用户观看直播的内容偏好等;
102.步骤s4:基于用户分析任务,生成数据分析模板;其中,数据分析模板为执行该用户分析任务时对照着执行的模板,具体的,比如:从用户观看直播的观看内容历史中分析哪种类型的内容直播受观看人数最多等;
103.步骤s5:基于数据分析模板,根据可信数据进行用户分析,获得用户分析结果。
104.上述技术方案的工作原理及有益效果为:
105.本技术在对观看直播的用户进行用户分析时,基于从直播大数据中提取出的可信数据进行用户分析,避免直播大数据中可能会存在不可信的数据导致用户分析误差的问题发生,提升了直播软件优化的精准性。在具体应用的时候,基于用户分析任务生成数据分析模板,快速根据可信数据进行用户分析,并将分析获得的用户分析结果输出供工作人员查看。
106.在一个实施例中,对直播大数据进行可信数据提取,获得可信数据,包括:
107.解析直播大数据中的多个数据项;其中,直播大数据由多个数据项组成,解析获得数据项;
108.获取数据项的来源途径的途径类型,途径类型包括:主动途径和被动途径;其中,途径类型为主动途经的来源途经是本地主动获取直播大数据的途经,具体的,比如:从网站网页中搜索获取(一些网站会发布直播行业内容偏好类型统计数据);途径类型为被动途经的来源途经是他方向本地提供直播大数据的途经,具体的,比如:主播平台提供、大数据平台(大数据平台会提供收集直播大数据的服务)提供等;
109.当途径类型为主动途径时,分别获取数据项的数据信息和来源途径的途径信息;其中,数据信息包括:数据项的总数据量、数据项中图片内容的占比等;途经信息包括:网站可信度、网站用户总数、网站日平均人气等;
110.基于预设的第一可信量化模板,对数据信息和途径信息进行可信量化,获得第一可信值;其中,第一可信值越大,数据信息和途经信息表示数据项的可信程度越高;第一可信量化模板为将数据信息和途径信息量化成第一可信值的模板,具体的,比如:数据项的总数据量>100kb、数据项中图片内容的占比>20%、网站可信度>70、网站用户总数>120、网站日平均人气>35,第一可信值为80;
111.当第一可信值大于等于预设的第一可信阈值时,将数据项作为可信数据;其中,第一可信阈值具体为,比如:70;第一可信值大于等于第一可信阈值时,数据项可信,作为可信数据;
112.当途径类型为被动途径时,分别获取来源途径的信用信息和来源途径对数据项进行可信担保的担保信息;其中,信息信息包括:来源途经历史上提供的直播大数据的信用值,历史上提供的直播大数据质量越低(具体的,比如:提供虚假信息),信用值越低;担保信息包括:担保值,来源途经对数据项进行可信担保的担保力度越大,担保值越大;
113.基于预设的第二可信量化模板,对信用信息和担保信息进行可信量化,获得第二可信值;其中,第二可信值越大,信用信息和担保信息表示数据项的可信程度越高;第二可
信量化模板为将信用信息和担保信息量化成第二可信值的模板,具体的,比如:信用值>5、担保值>6,第二可信值为60;
114.当第二可信值大于等于预设的第二可信阈值时,将数据项作为可信数据。其中,第二可信阈值具体为,比如:75;第二可信值大于等于第二可信阈值时,数据项可信,作为可信数据。
115.上述技术方案的工作原理及有益效果为:
116.本发明实施例在对直播大数据进行可信数据提取时,根据直播大数据中的数据项的途径类型不同,分别进行可信数据提取,提升了对直播大数据进行可信数据提取的全面性和适用性。分别引入第一可信量化模板和第二可信量化模板,快速分别确定第一可信值和第二可信值,提升了对直播大数据进行可信数据提取的提取效率。
117.在一个实施例中,获取用户分析任务,包括:
118.获取工作人员输入的用户分析任务;工作人员可自行输入用户分析任务;
119.和/或(“和/或”指的是用户分析任务的获取有两种方式),
120.交互式获取工作人员的用户分析需求;其中,用户分析需求为用户需要进行观看直播的用户分析的需求,具体的,比如:分析观看直播的用户爱看哪类直播;交互式获取指的是与用户互动式地进行获取,具体获取手段在下方实施例作详细介绍;
121.基于用户分析需求,确定用户分析任务。基于用户分析需求可以直接确定用户分析任务。
122.上述技术方案的工作原理及有益效果为:
123.本发明实施例引入两种方式获取用户分析任务,提升了用户分析任务获取的全面性和系统的适用性。
124.在一个实施例中,交互式获取工作人员的用户分析需求,包括:
125.获取工作人员对应的预设的权限场景库;其中,权限场景库包括:工作人员设定的有权限进行数据获取的操作场景,具体的,比如:直播后台数据查看界面、百度搜索界面等;
126.获取工作人员最近预设的时间内在权限场景库中的任一权限场景中产生的产生操作及对应的操作产生时间;其中,预设的时间为,比如:20分钟;产生操作为,比如:在直播后台数据查看界面查看当前人气最高的直播内容版块、百度搜索“哪些直播内容受欢迎”等;
127.基于操作产生时间,将产生操作设置于预设的时间轴线上;其中,时间轴线为上有多个按时序从左到右排列的时间点的轴线,设置产生操作时,在时间轴线上找操作产生时间对应的时间点所处位置进行设置;
128.基于产生操作簇约束条件,从时间轴线上确定产生操作簇;
129.从预设的用户分析需求预测库中确定产生操作簇对应的预测需求;其中,用户分析需求预测库中有不同产生操作簇对应的预测需求,预测需求产生操作簇中的产生操作代表的用户对观看直播的用户进行分析的需求,具体的,比如:产生操作簇中的产生操作依次为在直播后台数据查看界面查看当前人气最高的直播内容版块、百度搜索“哪些直播内容受欢迎”,则预测需求为分析用户观看直播的内容偏好;
130.基于预测需求,生成用户分析需求选择列表,并进行输出显示;将预测需求进行排列入表,获得用户分析需求选择列表;
131.接收工作人员从用户分析需求选择列表中挑选的预测需求,并作为用户分析需求;
132.其中,产生操作簇约束条件包括:
133.产生操作簇由时间轴线上连续n个产生操作组成;n为大于等于2的整数;
134.产生操作簇中的相邻产生操作之间的操作产生时间差小于等于预设的时间差阈值;其中,时间差阈值为,比如:100秒;
135.产生操作簇中的产生操作产生于的权限场景两两之间的场景关系与预设的标准场景关系库中的一个标准场景关系与匹配。其中,场景关系可以为,比如:直播后台数据查看界面-百度搜索界面等;工作人员在具备标准场景关系的权限场景中产生的操作表示工作人员越有可能有分析观看直播的用户的分析需求,比如:标准场景关系为直播后台数据查看界面-百度搜索界面,用户可能会在在直播后台数据查看界面查看当前人气最高的直播内容版块,再百度搜索哪些直播内容受欢迎,说明用户可能有分析分析用户观看直播的内容偏好的需求。
136.上述技术方案的工作原理及有益效果为:
137.其中,满足上述三个条件即产生操作簇约束条件时,说明用户在短时间内在越可能反应工作人员有分析需求的权限场景内连续产生对应产生操作,筛选出产生操作簇,基于用户分析需求预测库进行预测需求的确定,提升了交互式获取工作人员的用户分析需求的精准性和效率。基于预测需求生成用户分析需求选择列表,供用户挑选,实现交互,提升了工作人员体验,同时,也更加人性化。
138.在一个实施例中,基于用户分析任务,生成数据分析模板,包括:
139.基于预设的特征提取模板,对用户分析任务进行特征提取,获得多个任务特征;其中,任务特征包括:有哪些分析观看直播的用户的分析任务,具体的,比如:分析用户观看直播的内容偏好;
140.基于任务特征,构建用户分析任务的特征描述向量;其中,特征描述向量为任务特征以向量形式构建成;
141.从预设的数据分析规则库中确定特征描述向量对应的至少一个第一数据分析规则;其中,数据分析规则库中有不同特征描述向量对应的第一数据分析规则,第一数据分析规则为执行特征描述向量中的分析观看直播的用户的分析任务用的规则,具体的,比如:从用户观看直播的观看内容历史中分析哪种类型的内容直播受观看人数最多等;
142.从工作人员对应的预设的偏好数据分析规则库中确定特征描述向量对应的至少一个第二数据分析规则;其中,偏好数据分析规则中有不同特征描述向量中的分析观看直播的用户的分析任务对应的工作人员偏好的第二数据分析规则,具体的,比如:从用户观看直播的观看内容历史中分析受观看人数排名前5的直播内容类型;
143.基于互补处理规则,对第一数据分析规则和第二数据分析规则进行互补处理,获得多个第三数据分析规则;
144.基于第三数据分析规则,生成数据分析模板;其中,生成数据分析模板时,将第三数据分析规则一一排列获得;
145.其中,互补处理规则包括:
146.当第一数据分析规则和第二数据分析规则中各自存在一个同类型数据分析规则
时,分别获取同类型数据分析规则对应的预设的普适偏好值以及工作人员对同类型数据分析规则偏好的个性偏好值;其中,第一数据分析规则和第二数据分析规则的类型有,比如:分析用户观看直播的内容偏好;普适偏好值表示大部分工作人员对于同类型数据分析规则的偏好程度,普适偏好值越大,该偏好程度越高;个性偏好值为工作人员自身对于同类型数据分析规则的偏好程度,个性偏好值越大,该偏好程度越高;
147.当个性偏好值大于等于预设的个性偏好阈值和/或个性偏好值大于普适偏好值的差值大于等于预设的差值阈值时,从第一数据分析规则中剔除同类型数据分析规则;其中,个性偏好阈值具体的,比如:75;当个性偏好值大于等于个性偏好阈值时,说明工作人员特别偏好该同类型数据分析规则,因此,剔除第一数据分析规则中的该同类型数据分析规则;当个性偏好值大于普适偏好值的差值大于等于预设的差值阈值时,说明工作人员偏好该同类型数据分析规则程度远比大部分工作人员对于同类型数据分析规则的偏好程度要高,因此,剔除第一数据分析规则中的该同类型数据分析规则;
148.将剩余的第一数据分析规则和第二数据分析规则作为第三数据分析规则。
149.上述技术方案的工作原理及有益效果为:
150.基于用户分析任务,生成数据分析模板时,不只是考虑到用户偏好因素,而是考虑到用户偏好程度即个性偏好值,将第一数据分析规则和第二数据分析规则进行互补处理,提升了数据分析模板生成的合理性。另外,引入互补处理规则,可以仅采取用户特别偏好的同类型数据分析规则,对可信数据进行分析,输出用户偏好的结果,还可以采取大部分工作人员偏好的同类型数据分析规则,对可信数据进行分析,输出用户偏好的结果,供用户参考,更加人性化。
151.本发明实施例提供了基于直播大数据的用户分析系统,如图2所示,其特征在于,包括:
152.直播大数据搜罗模块1,用于搜罗直播大数据;
153.可信数据提取模块2,用于对直播大数据进行可信数据提取,获得可信数据;
154.用户分析任务获取模块3,用于获取用户分析任务;
155.数据分析模板生成模块4,用于基于用户分析任务,生成数据分析模板;
156.用户分析模块5,用于基于数据分析模板,根据可信数据进行用户分析,获得用户分析结果。
157.在一个实施例中,可信数据提取模块2对直播大数据进行可信数据提取,获得可信数据,包括:
158.解析直播大数据中的多个数据项;
159.获取数据项的来源途径的途径类型,途径类型包括:主动途径和被动途径;
160.当途径类型为主动途径时,分别获取数据项的数据信息和来源途径的途径信息;
161.基于预设的第一可信量化模板,对数据信息和途径信息进行可信量化,获得第一可信值;
162.当第一可信值大于等于预设的第一可信阈值时,将数据项作为可信数据;
163.当途径类型为被动途径时,分别获取来源途径的信用信息和来源途径对数据项进行可信担保的担保信息;
164.基于预设的第二可信量化模板,对信用信息和担保信息进行可信量化,获得第二
可信值;
165.当第二可信值大于等于预设的第二可信阈值时,将数据项作为可信数据。
166.在一个实施例中,用户分析任务获取模块3获取用户分析任务,包括:
167.获取工作人员输入的用户分析任务;
168.和/或,
169.交互式获取工作人员的用户分析需求;
170.基于用户分析需求,确定用户分析任务。
171.在一个实施例中,用户分析任务获取模块3交互式获取工作人员的用户分析需求,包括:
172.获取工作人员对应的预设的权限场景库;
173.获取工作人员最近预设的时间内在权限场景库中的任一权限场景中产生的产生操作及对应的操作产生时间;
174.基于操作产生时间,将产生操作设置于预设的时间轴线上;
175.基于产生操作簇约束条件,从时间轴线上确定产生操作簇;
176.从预设的用户分析需求预测库中确定产生操作簇对应的预测需求;
177.基于预测需求,生成用户分析需求选择列表,并进行输出显示;
178.接收工作人员从用户分析需求选择列表中挑选的预测需求,并作为用户分析需求;
179.其中,产生操作簇约束条件包括:
180.产生操作簇由时间轴线上连续n个产生操作组成;n为大于等于2的整数;
181.产生操作簇中的相邻产生操作之间的操作产生时间差小于等于预设的时间差阈值;
182.产生操作簇中的产生操作产生于的权限场景两两之间的场景关系与预设的标准场景关系库中的一个标准场景关系与匹配。
183.在一个实施例中,数据分析模板生成模块4基于用户分析任务,生成数据分析模板,包括:
184.基于预设的特征提取模板,对用户分析任务进行特征提取,获得多个任务特征;
185.基于任务特征,构建用户分析任务的特征描述向量;
186.从预设的数据分析规则库中确定特征描述向量对应的至少一个第一数据分析规则;
187.从工作人员对应的预设的偏好数据分析规则库中确定特征描述向量对应的至少一个第二数据分析规则;
188.基于互补处理规则,对第一数据分析规则和第二数据分析规则进行互补处理,获得多个第三数据分析规则;
189.基于第三数据分析规则,生成数据分析模板;
190.其中,互补处理规则包括:
191.当第一数据分析规则和第二数据分析规则中各自存在一个同类型数据分析规则时,分别获取同类型数据分析规则对应的预设的普适偏好值以及工作人员对同类型数据分析规则偏好的个性偏好值;
192.当个性偏好值大于等于预设的个性偏好阈值和/或个性偏好值大于普适偏好值的差值大于等于预设的差值阈值时,从第一数据分析规则中剔除同类型数据分析规则;
193.将剩余的第一数据分析规则和第二数据分析规则作为第三数据分析规则。
194.显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
技术特征:
1.基于直播大数据的用户分析方法,其特征在于,包括:搜罗直播大数据;对所述直播大数据进行可信数据提取,获得可信数据;获取用户分析任务;基于所述用户分析任务,生成数据分析模板;基于所述数据分析模板,根据所述可信数据进行用户分析,获得用户分析结果。2.如权利要求1所述的基于直播大数据的用户分析方法,其特征在于,所述对所述直播大数据进行可信数据提取,获得可信数据,包括:解析所述直播大数据中的多个数据项;获取所述数据项的来源途径的途径类型,所述途径类型包括:主动途径和被动途径;当所述途径类型为所述主动途径时,分别获取所述数据项的数据信息和所述来源途径的途径信息;基于预设的第一可信量化模板,对所述数据信息和所述途径信息进行可信量化,获得第一可信值;当所述第一可信值大于等于预设的第一可信阈值时,将所述数据项作为所述可信数据;当所述途径类型为所述被动途径时,分别获取所述来源途径的信用信息和所述来源途径对所述数据项进行可信担保的担保信息;基于预设的第二可信量化模板,对所述信用信息和所述担保信息进行可信量化,获得第二可信值;当所述第二可信值大于等于预设的第二可信阈值时,将所述数据项作为所述可信数据。3.如权利要求1所述的基于直播大数据的用户分析方法,其特征在于,所述获取用户分析任务,包括:获取工作人员输入的所述用户分析任务;和/或,交互式获取工作人员的用户分析需求;基于所述用户分析需求,确定所述用户分析任务。4.如权利要求3所述的基于直播大数据的用户分析方法,其特征在于,所述交互式获取工作人员的用户分析需求,包括:获取工作人员对应的预设的权限场景库;获取工作人员最近预设的时间内在所述权限场景库中的任一权限场景中产生的产生操作及对应的操作产生时间;基于所述操作产生时间,将所述产生操作设置于预设的时间轴线上;基于产生操作簇约束条件,从所述时间轴线上确定产生操作簇;从预设的用户分析需求预测库中确定所述产生操作簇对应的预测需求;基于所述预测需求,生成用户分析需求选择列表,并进行输出显示;接收工作人员从所述用户分析需求选择列表中挑选的所述预测需求,并作为所述用户分析需求;
其中,所述产生操作簇约束条件包括:所述产生操作簇由所述时间轴线上连续n个所述产生操作组成;n为大于等于2的整数;所述产生操作簇中的相邻所述产生操作之间的操作产生时间差小于等于预设的时间差阈值;所述产生操作簇中的所述产生操作产生于的所述权限场景两两之间的场景关系与预设的标准场景关系库中的一个标准场景关系与匹配。5.如权利要求1所述的基于直播大数据的用户分析方法,其特征在于,所述基于所述用户分析任务,生成数据分析模板,包括:基于预设的特征提取模板,对所述用户分析任务进行特征提取,获得多个任务特征;基于所述任务特征,构建所述用户分析任务的特征描述向量;从预设的数据分析规则库中确定所述特征描述向量对应的至少一个第一数据分析规则;从工作人员对应的预设的偏好数据分析规则库中确定所述特征描述向量对应的至少一个第二数据分析规则;基于互补处理规则,对所述第一数据分析规则和所述第二数据分析规则进行互补处理,获得多个第三数据分析规则;基于所述第三数据分析规则,生成所述数据分析模板;其中,所述互补处理规则包括:当所述第一数据分析规则和所述第二数据分析规则中各自存在一个同类型数据分析规则时,分别获取所述同类型数据分析规则对应的预设的普适偏好值以及工作人员对所述同类型数据分析规则偏好的个性偏好值;当所述个性偏好值大于等于预设的个性偏好阈值和/或所述个性偏好值大于所述普适偏好值的差值大于等于预设的差值阈值时,从所述第一数据分析规则中剔除所述同类型数据分析规则;将剩余的所述第一数据分析规则和所述第二数据分析规则作为所述第三数据分析规则。6.基于直播大数据的用户分析系统,其特征在于,包括:直播大数据搜罗模块,用于搜罗直播大数据;可信数据提取模块,用于对所述直播大数据进行可信数据提取,获得可信数据;用户分析任务获取模块,用于获取用户分析任务;数据分析模板生成模块,用于基于所述用户分析任务,生成数据分析模板;用户分析模块,用于基于所述数据分析模板,根据所述可信数据进行用户分析,获得用户分析结果。7.如权利要求6所述的基于直播大数据的用户分析系统,其特征在于,所述可信数据提取模块对所述直播大数据进行可信数据提取,获得可信数据,包括:解析所述直播大数据中的多个数据项;获取所述数据项的来源途径的途径类型,所述途径类型包括:主动途径和被动途径;当所述途径类型为所述主动途径时,分别获取所述数据项的数据信息和所述来源途径的途径信息;
基于预设的第一可信量化模板,对所述数据信息和所述途径信息进行可信量化,获得第一可信值;当所述第一可信值大于等于预设的第一可信阈值时,将所述数据项作为所述可信数据;当所述途径类型为所述被动途径时,分别获取所述来源途径的信用信息和所述来源途径对所述数据项进行可信担保的担保信息;基于预设的第二可信量化模板,对所述信用信息和所述担保信息进行可信量化,获得第二可信值;当所述第二可信值大于等于预设的第二可信阈值时,将所述数据项作为所述可信数据。8.如权利要求6所述的基于直播大数据的用户分析系统,其特征在于,所述用户分析任务获取模块获取用户分析任务,包括:获取工作人员输入的所述用户分析任务;和/或,交互式获取工作人员的用户分析需求;基于所述用户分析需求,确定所述用户分析任务。9.如权利要求8所述的基于直播大数据的用户分析系统,其特征在于,所述用户分析任务获取模块交互式获取工作人员的用户分析需求,包括:获取工作人员对应的预设的权限场景库;获取工作人员最近预设的时间内在所述权限场景库中的任一权限场景中产生的产生操作及对应的操作产生时间;基于所述操作产生时间,将所述产生操作设置于预设的时间轴线上;基于产生操作簇约束条件,从所述时间轴线上确定产生操作簇;从预设的用户分析需求预测库中确定所述产生操作簇对应的预测需求;基于所述预测需求,生成用户分析需求选择列表,并进行输出显示;接收工作人员从所述用户分析需求选择列表中挑选的所述预测需求,并作为所述用户分析需求;其中,所述产生操作簇约束条件包括:所述产生操作簇由所述时间轴线上连续n个所述产生操作组成;n为大于等于2的整数;所述产生操作簇中的相邻所述产生操作之间的操作产生时间差小于等于预设的时间差阈值;所述产生操作簇中的所述产生操作产生于的所述权限场景两两之间的场景关系与预设的标准场景关系库中的一个标准场景关系与匹配。10.如权利要求6所述的基于直播大数据的用户分析系统,其特征在于,所述数据分析模板生成模块基于所述用户分析任务,生成数据分析模板,包括:基于预设的特征提取模板,对所述用户分析任务进行特征提取,获得多个任务特征;基于所述任务特征,构建所述用户分析任务的特征描述向量;从预设的数据分析规则库中确定所述特征描述向量对应的至少一个第一数据分析规则;
从工作人员对应的预设的偏好数据分析规则库中确定所述特征描述向量对应的至少一个第二数据分析规则;基于互补处理规则,对所述第一数据分析规则和所述第二数据分析规则进行互补处理,获得多个第三数据分析规则;基于所述第三数据分析规则,生成所述数据分析模板;其中,所述互补处理规则包括:当所述第一数据分析规则和所述第二数据分析规则中各自存在一个同类型数据分析规则时,分别获取所述同类型数据分析规则对应的预设的普适偏好值以及工作人员对所述同类型数据分析规则偏好的个性偏好值;当所述个性偏好值大于等于预设的个性偏好阈值和/或所述个性偏好值大于所述普适偏好值的差值大于等于预设的差值阈值时,从所述第一数据分析规则中剔除所述同类型数据分析规则;将剩余的所述第一数据分析规则和所述第二数据分析规则作为所述第三数据分析规则。
技术总结
本发明提供基于直播大数据的用户分析方法及系统,其中方法包括:搜罗直播大数据;对直播大数据进行可信数据提取,获得可信数据;获取用户分析任务;基于用户分析任务,生成数据分析模板;基于数据分析模板,根据可信数据进行用户分析,获得用户分析结果。本发明的基于直播大数据的用户分析方法及系统,在对观看直播的用户进行用户分析时,基于从直播大数据中提取出的可信数据进行用户分析,避免直播大数据中可能会存在不可信的数据导致用户分析误差的问题发生,提升了直播软件优化的精准性。提升了直播软件优化的精准性。提升了直播软件优化的精准性。
技术研发人员:邹旭光
受保护的技术使用者:北京能量时光教育科技有限公司
技术研发日:2023.07.05
技术公布日:2023/10/8
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/