用户行为预测方法、装置、设备及存储介质与流程

未命名 09-01 阅读:107 评论:0


1.本发明涉及人工智能及金融技术领域,尤其涉及一种用户行为预测方法、装置、设备及存储介质。


背景技术:

2.目前,在用户向客户询问购买意向等业务场景上,用户通常随机向所有客户群发短信或者邮件等,这种方式的上行答复率在1%左右,造成了成本的极大浪费,同时给非意向客户造成短信骚扰,影响用户体验。
3.为了提高用户体验,在人工智能领域中,通常会先预测用户针对群发短信及群发邮件的反馈情况,进而根据预测情况选择是否对该用户进行短信的发送。然而,在现有的用户答复反馈预测方案中,通常直接利用任意的预测网络模型对用户答复反馈请求进行预测,由于没有对该预测网络模型进行业务适配选择,导致无法准确的预测出用户对咨询情况的答复情况,造成客户的流失。随着金融科技的发展,用户答复反馈预测方案可以支持购物、社交、互动游戏、资源转移等功能。


技术实现要素:

4.鉴于以上内容,有必要提供一种用户行为预测方法、装置、设备及存储介质,能够解决如何准确的预测出用户对咨询情况的答复情况的技术问题。
5.一方面,本发明提出一种用户行为预测方法,所述用户行为预测方法包括:
6.从获取到的多个特征标签中筛选出目标标签;
7.获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本;
8.将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果;
9.根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标;
10.基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型;
11.响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。
12.根据本发明优选实施例,所述从获取到的多个特征标签中筛选出目标标签包括:
13.获取每个特征标签的特征信息及所述特征信息所对应的特征结果;
14.根据所述特征信息,计算每个特征标签的标签方差;
15.统计取值相同的特征信息所对应的结果不同的特征结果的信息数量,并统计每个特征标签中所述特征信息的特征总量;
16.根据所述信息数量及所述特征总量,计算每个特征标签的目标比例;
17.识别每个特征标签所对应的标签类型;
18.根据所述标签方差、所述目标比例及所述标签类型,从所述多个特征标签中筛选出所述目标标签。
19.根据本发明优选实施例,所述根据所述标签方差、所述目标比例及所述标签类型,从所述多个特征标签中筛选出所述目标标签包括:
20.比较所述标签方差与第一预设阈值,并比较所述目标比例与第二预设阈值;
21.若同一标签类型下的特征标签所对应的标签方差均小于所述第一预设阈值,及同一标签类型下的特征标签所对应的目标比例均大于所述第二预设阈值,则从该标签类型的特征标签中选取所述标签方差最大及/或所述目标比例最小所对应的特征标签作为所述目标标签;或者
22.若同一标签类型下的特征标签所对应的标签方差不都小于所述第一预设阈值,则从该特征标签的特征标签中选取所述标签方差大于或者等于所述第一预设阈值的特征标签作为所述目标标签;或者
23.若同一标签类型下的特征标签所对应的目标比例不都大于所述第二预设阈值,则从该特征标签的特征标签中选取所述目标比例小于或者等于所述第二预设阈值的特征标签作为所述目标标签。
24.根据本发明优选实施例,所述将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果包括:
25.识别出所述训练信息的信息类型;
26.基于预设编码表对所述信息类型为字符型的训练信息进行编码处理,得到第一编码,并对所述训练文本进行编码处理,得到第二编码;
27.将所述信息类型为数值型的训练信息进行数值转换,得到数值分布信息;
28.对所述数值分布信息进行标准化处理,得到第三编码;
29.拼接所述第一编码、所述第二编码及所述第三编码,得到目标编码;
30.根据所述多个行为预测模型对所述目标编码进行处理,得到所述预测行为结果。
31.根据本发明优选实施例,所述多个模型指标包括第一指标、第二指标、第三指标及第四指标,所述根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标包括:
32.对于每个行为预测模型,统计所述预测行为结果及所述用户行为结果均为第一配置结果的训练用户的用户数量作为第一数量,并统计所述预测行为结果及所述用户行为结果均为第二配置结果的训练用户的用户数量作为第二数量;
33.统计所述预测行为结果为所述第一配置结果及所述用户行为结果为所述第二配置结果的训练用户的用户数量作为第三数量,并统计所述预测行为结果为所述第二配置结果及所述用户行为结果为所述第一配置结果的训练用户的用户数量作为第四数量;
34.根据所述第一数量及所述第四数量生成所述第一指标,并根据所述第一数量及所述第三数量生成所述第二指标;
35.根据所述第一数量、所述第二数量、所述第三数量及所述第四数量生成第三指标,并根据所述第一指标及所述第二指标生成所述第四指标。
36.根据本发明优选实施例,所述基于所述目标模型对所述用户行为预测请求中测试
用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果包括:
37.解析所述用户行为预测请求的请求报文,得到所述请求报文携带的数据信息;
38.从所述数据信息中提取所述测试用户的用户标识;
39.基于所述用户标识及所述目标标签生成查询语句;
40.基于配置信息库,运行所述查询语句,得到所述用户信息;
41.从所述数据信息中的路径地址中定位出所述测试文本;
42.对所述用户信息及所述测试文本进行信息编码,得到输入向量;
43.根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果。
44.根据本发明优选实施例,所述目标模型包括正向网络层、反向网络层及多个预测分析树,所述根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果包括:
45.基于所述正向网络层对所述输入向量进行特征提取,得到第一特征,并基于所述反向网络层对所述输入向量进行特征提取,得到第二特征;
46.根据所述第一特征及所述第二特征生成所述输入向量的目标特征;
47.从每个预测分析树中获取出与所述目标特征相匹配的匹配结果;
48.统计每个匹配结果的结果数量,并将所述结果数量最大的匹配结果确定为所述目标行为结果。
49.另一方面,本发明还提出一种用户行为预测装置,所述用户行为预测装置包括:
50.筛选单元,用于从获取到的多个特征标签中筛选出目标标签;
51.获取单元,用于获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本;
52.输入单元,用于将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果;
53.生成单元,用于根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标;
54.所述筛选单元,还用于基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型;
55.预测单元,用于响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。
56.另一方面,本发明还提出一种电子设备,所述电子设备包括:
57.存储器,存储计算机可读指令;及
58.处理器,执行所述存储器中存储的计算机可读指令以实现所述用户行为预测方法。
59.另一方面,本发明还提出一种计算机可读存储介质,所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现所述用户行为预测方法。
60.由以上技术方案可以看出,本技术通过对所述多个特征标签进行特征分析,能够
合理的筛选出所述目标标签,由于减少对所述多个特征标签的分析,因此能够提高行为预测分析效率,通过将所述训练信息输入至所述多个行为预测模型中进行分析,并结合所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标,进而根据所述多个模型指标,能够从所述多个行为预测模型中准确的筛选出目标模型,提高所述目标模型对行为预测的准确性,因此,本技术能够提高所述目标行为结果的识别准确性及识别效率。
附图说明
61.图1是本发明用户行为预测方法的较佳实施例的流程图。
62.图2是本发明用户行为预测方法中目标模型的模型结构图。
63.图3是本发明用户行为预测装置的较佳实施例的功能模块图。
64.图4是本发明实现用户行为预测方法的较佳实施例的电子设备的结构示意图。
具体实施方式
65.为了使本发明的目的、技术方案和优点更加清楚,下面结合附图和具体实施例对本发明进行详细描述。
66.如图1所示,是本发明用户行为预测方法的较佳实施例的流程图。根据不同的需求,该流程图中步骤的顺序可以改变,某些步骤可以省略。
67.所述用户行为预测方法可以基于人工智能技术对相关的数据进行获取和处理。其中,人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。
68.人工智能基础技术一般包括如传感器、专用人工智能芯片、云计算、分布式存储、大数据处理技术、操作/交互系统、机电一体化等技术。人工智能软件技术主要包括计算机视觉技术、机器人技术、生物识别技术、语音处理技术、自然语言处理技术以及机器学习/深度学习等几大方向。
69.所述用户行为预测方法应用于一个或者多个电子设备中,所述电子设备是一种能够按照事先设定或存储的计算机可读指令,自动进行数值计算和/或信息处理的设备,其硬件包括但不限于微处理器、专用集成电路(application specific integrated circuit,asic)、可编程门阵列(field-programmable gate array,fpga)、数字信号处理器(digital signal processor,dsp)、嵌入式设备等。
70.所述电子设备可以是任何一种可与用户进行人机交互的电子产品,例如,个人计算机、平板电脑、智能手机、个人数字助理(personal digital assistant,pda)、游戏机、交互式网络电视(internet protocol television,iptv)、智能穿戴式设备等。
71.所述电子设备可以包括网络设备和/或用户设备。其中,所述网络设备包括,但不限于单个网络电子设备、多个网络电子设备组成的电子设备组或基于云计算(cloud computing)的由大量主机或网络电子设备构成的云。
72.所述电子设备所在的网络包括,但不限于:互联网、广域网、城域网、局域网、虚拟专用网络(virtual private network,vpn)等。
73.101,从获取到的多个特征标签中筛选出目标标签。
74.在本发明的至少一个实施例中,所述多个特征标签可以包括,但不限于:用户感兴趣标签、用户交易标签等。
75.所述目标标签是指特征信息的方差较大及特征信息与特征结果冲突量较小的特征标签。
76.在本发明的至少一个实施例中,所述电子设备从获取到的多个特征标签中筛选出目标标签包括:
77.获取每个特征标签的特征信息及所述特征信息所对应的特征结果;
78.根据所述特征信息,计算每个特征标签的标签方差;
79.统计取值相同的特征信息所对应的结果不同的特征结果的信息数量,并统计每个特征标签中所述特征信息的特征总量;
80.根据所述信息数量及所述特征总量,计算每个特征标签的目标比例;
81.识别每个特征标签所对应的标签类型;
82.根据所述标签方差、所述目标比例及所述标签类型,从所述多个特征标签中筛选出所述目标标签。
83.其中,所述特征信息是指所述特征标签所对应的信息,例如,所述特征标签为用户感兴趣标签,所述特征信息可以是上网等。
84.所述特征结果是指与所述多个特征标签的特征信息同时对应的结果,例如,所述特征结果可以是收到用户回复反馈。
85.所述目标比例是指所述信息数量与所述特征总量的比值。
86.所述标签类型包括,但不限于:预测类型、统计类型及事实类型等。
87.通过计算所述标签方差,能够避免所述特征信息的差异较小而无法准确的区分出所述特征结果,通过计算所述目标比例,能够避免所述目标标签中存在大量取值相同的特征信息所对应不同的特征结果,进而结合所述标签类型,提高了所述目标标签的确定合理性,通过对所述多个特征标签的筛选,能够减少所述多个特征标签的数量,从而提高行为分析效率。
88.具体地,所述电子设备根据所述标签方差、所述目标比例及所述标签类型,从所述多个特征标签中筛选出所述目标标签包括:
89.比较所述标签方差与第一预设阈值,并比较所述目标比例与第二预设阈值;
90.若同一标签类型下的特征标签所对应的标签方差均小于所述第一预设阈值,及同一标签类型下的特征标签所对应的目标比例均大于所述第二预设阈值,则从该标签类型的特征标签中选取所述标签方差最大及/或所述目标比例最小所对应的特征标签作为所述目标标签;或者
91.若同一标签类型下的特征标签所对应的标签方差不都小于所述第一预设阈值,则从该特征标签的特征标签中选取所述标签方差大于或者等于所述第一预设阈值的特征标签作为所述目标标签;或者
92.若同一标签类型下的特征标签所对应的目标比例不都大于所述第二预设阈值,则从该特征标签的特征标签中选取所述目标比例小于或者等于所述第二预设阈值的特征标签作为所述目标标签。
93.其中,所述第一预设阈值及所述第二预设阈值可以根据实际需求设定,本技术对
此不再限定。
94.通过上述实施方式,能够避免因所述第一预设阈值及所述第二预设阈值设定不合理而导致存在任一标签类型所对应的特征标签被剔除,从而提高了所述目标标签的确定合理性。
95.102,获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本。
96.在本发明的至少一个实施例中,所述多个训练用户可以是任意已知回复反馈情况的用户。
97.所述训练信息是指所述多个训练用户在所述目标标签上所对应的具体信息。
98.所述用户行为结果包括,但不限于:收到用户回复反馈、未收到用户回复反馈。
99.所述训练文本可以是关于兑换业务的短信内容。
100.103,将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果。
101.在本发明的至少一个实施例中,所述多个行为预测模型包括以下至少一个模型的组合:
102.基于随机森林算法的行为预测模型、基于梯度提升决策树的行为预测模型、基于逻辑回归算法的行为预测模型、基于极致梯度提升的行为预测模型。
103.在本发明的至少一个实施例中,所述预测行为结果包括,但不限于:收到用户回复反馈、未收到用户回复反馈。
104.在本发明的至少一个实施例中,所述电子设备将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果包括:
105.识别出所述训练信息的信息类型;
106.基于预设编码表对所述信息类型为字符型的训练信息进行编码处理,得到第一编码,并对所述训练文本进行编码处理,得到第二编码;
107.将所述信息类型为数值型的训练信息进行数值转换,得到数值分布信息;
108.对所述数值分布信息进行标准化处理,得到第三编码;
109.拼接所述第一编码、所述第二编码及所述第三编码,得到目标编码;
110.根据所述多个行为预测模型对所述目标编码进行处理,得到所述预测行为结果。
111.其中,所述信息类型包括:所述字符型及所述数值型。
112.所述预设编码表中存储有多个字符与元素向量的映射关系。
113.所述数值分布信息是指对所述信息类型为数值型的训练信息进行数值转换后所生成的信息。
114.通过识别出所述信息类型,进而通过所述预设编码表对所述信息类型为字符型的训练信息进行编码处理,能够避免所述第一编码中出现稀疏矩阵的问题,通过对所述信息类型为数值型的训练信息进行数值转换,能够使得所述数值分布信息呈现一定的分布规律,提高所述第三编码的编码准确性,从而结合所述第一编码、所述第二编码及所述第三编码,能够准确地表征出所述训练信息及所述训练文本,进而通过所述多个行为预测模型对所述目标编码进行处理,能够避免因表征错误而导致的预测错误的问题。
115.具体地,所述数值分布信息的生成公式为:
116.y=log(n+1),其中,y表示所述数值分布信息,n表示所述信息类型为数值型的训练信息。
117.通过对数函数能够使得所述数值分布信息呈现一定的分布规律,通过引入数值1,能够避免所述数值分布信息没有意义。
118.104,根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标。
119.在本发明的至少一个实施例中,多个所述模型指标包括第一指标、第二指标、第三指标及第四指标。
120.在本发明的至少一个实施例中,所述电子设备根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标包括:
121.对于每个行为预测模型,统计所述预测行为结果及所述用户行为结果均为第一配置结果的训练用户的用户数量作为第一数量,并统计所述预测行为结果及所述用户行为结果均为第二配置结果的训练用户的用户数量作为第二数量;
122.统计所述预测行为结果为所述第一配置结果及所述用户行为结果为所述第二配置结果的训练用户的用户数量作为第三数量,并统计所述预测行为结果为所述第二配置结果及所述用户行为结果为所述第一配置结果的训练用户的用户数量作为第四数量;
123.根据所述第一数量及所述第四数量生成所述第一指标,并根据所述第一数量及所述第三数量生成所述第二指标;
124.根据所述第一数量、所述第二数量、所述第三数量及所述第四数量生成第三指标,并根据所述第一指标及所述第二指标生成所述第四指标。
125.其中,所述第一配置结果通常设定为收到用户回复反馈,所述第二配置结果通常设定为未收到用户回复反馈。
126.通过所述预测行为结果及所述用户行为结果分别与所述第一配置结果及所述第二配置结果的比较,能够准确的量化出所述第一数量、所述第二数量、所述第三数量及所述第四数量,从而提高每个行为预测模型的模型指标的生成准确性。
127.具体地,所述第一指标的生成公式为:
128.所述第二指标的生成公式为:
129.所述第三指标的生成公式为:
130.所述第四指标的生成公式为:
131.其中,k1表示所述第一指标,k2表示所述第二指标,k3表示所述第三指标,k4表示所述第四指标,a表示第一数量,b表示第二数量,c表示第三数量,d表示第四数量,z表示预设常数。
132.105,基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型。
133.在本发明的至少一个实施例中,所述目标模型是指所述多个模型指标最大的行为预测模型。
134.如图2所示,是本发明用户行为预测方法中目标模型的模型结构图。在图2中,所述目标模型可以包括正向网络层、反向网络层及多个预测分析树。所述目标模型还可以有其他表现形式。
135.在本发明的至少一个实施例中,所述电子设备基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型包括:
136.对所述多个模型指标进行加权和运算,得到目标指标;
137.将取值最大的目标指标所对应的行为预测模型确定为所述目标模型。
138.通过上述实施方式,能够快速的确定出所述目标模型。
139.106,响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。
140.需要强调的是,为进一步保证上述目标行为结果的私密和安全性,上述目标行为结果还可以存储于一区块链的节点中。
141.在本发明的至少一个实施例中,所述用户行为预测请求可以是在需要检测用户是否会针对短信内容或者邮件内容进行内容回复时触发生成的请求。所述用户行为预测请求携带的信息包括,但不限于:所述测试用户的用户标识、所述测试文本的路径地址等。其中,所述测试用户是指需要进行针对所述测试文本进行行为预测的用户,所述测试文本是指需要进行用户行为预测的文本,所述测试文本可以是短信内容。
142.所述用户信息是指所述测试用户在所述目标标签上所对应的数据信息。
143.所述目标行为结果可以包括,但不限于:收到用户回复反馈、未收到用户回复反馈。
144.在本发明的至少一个实施例中,所述电子设备
145.基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果包括:
146.解析所述用户行为预测请求的请求报文,得到所述请求报文携带的数据信息;
147.从所述数据信息中提取所述测试用户的用户标识;
148.基于所述用户标识及所述目标标签生成查询语句;
149.基于配置信息库,运行所述查询语句,得到所述用户信息;
150.从所述数据信息中的路径地址中定位出所述测试文本;
151.对所述用户信息及所述测试文本进行信息编码,得到输入向量;
152.根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果。
153.其中,所述用户标识用于唯一标识所述测试用户。
154.所述查询语句可以是结构化查询语句。
155.所述配置信息库中存储有多个经用户授权的个人基础信息。
156.通过解析所述请求报文,能够快速的获取到所述数据信息,进而通过所述用户标识及所述目标标签,能够直接在所述配置信息库中获取到所述用户信息,提高了所述用户信息的获取效率,从而提高所述目标行为结果的生成效率。
157.具体地,所述输入向量的生成方式与所述目标编码的生成方式相似,本技术对此不再赘述。
158.具体地,当所述目标模型包括正向网络层、反向网络层及多个预测分析树时,所述电子设备根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果包括:
159.基于所述正向网络层对所述输入向量进行特征提取,得到第一特征,并基于所述反向网络层对所述输入向量进行特征提取,得到第二特征;
160.根据所述第一特征及所述第二特征生成所述输入向量的目标特征;
161.从每个预测分析树中获取出与所述目标特征相匹配的匹配结果;
162.统计每个匹配结果的结果数量,并将所述结果数量最大的匹配结果确定为所述目标行为结果。
163.其中,所述正向网络层及所述反向网络层可以是双向记忆神经网络中的网络层。
164.所述目标特征是指所述第一特征中的特征元素与所述第二特征的特征元素的元素平均和。
165.通过所述正向网络层及所述反向网络层对所述输入向量进行特征提取,能够结合所述输入向量的正向特征及反向特征对所述目标特征进行表征,提高了所述目标特征的表征能力,进而通过所述多个预测分析树能够合理的筛选出所述匹配结果,进而通过多个所述匹配结果,能够准确的识别出所述目标行为结果。
166.由以上技术方案可以看出,本技术通过对所述多个特征标签进行特征分析,能够合理的筛选出所述目标标签,由于减少对所述多个特征标签的分析,因此能够提高行为预测分析效率,通过将所述训练信息输入至所述多个行为预测模型中进行分析,并结合所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标,进而根据所述多个模型指标,能够从所述多个行为预测模型中准确的筛选出目标模型,提高所述目标模型对行为预测的准确性,因此,本技术能够提高所述目标行为结果的识别准确性及识别效率。
167.如图3所示,是本发明用户行为预测装置的较佳实施例的功能模块图。所述用户行为预测装置11包括筛选单元110、获取单元111、输入单元112、生成单元113及预测单元114。本发明所称的模块/单元是指一种能够被处理器13所获取,并且能够完成固定功能的一系列计算机可读指令段,其存储在存储器12中。在本实施例中,关于各模块/单元的功能将在后续的实施例中详述。
168.筛选单元110,用于从获取到的多个特征标签中筛选出目标标签;
169.获取单元111,用于获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本;
170.输入单元112,用于将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果;
171.生成单元113,用于根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标;
172.所述筛选单元110,还用于基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型;
173.预测单元114,用于响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。
174.在本发明的至少一个实施例中,所述筛选单元110,还用于获取每个特征标签的特
征信息及所述特征信息所对应的特征结果;
175.根据所述特征信息,计算每个特征标签的标签方差;
176.统计取值相同的特征信息所对应的结果不同的特征结果的信息数量,并统计每个特征标签中所述特征信息的特征总量;
177.根据所述信息数量及所述特征总量,计算每个特征标签的目标比例;
178.识别每个特征标签所对应的标签类型;
179.根据所述标签方差、所述目标比例及所述标签类型,从所述多个特征标签中筛选出所述目标标签。
180.在本发明的至少一个实施例中,所述筛选单元110,还用于比较所述标签方差与第一预设阈值,并比较所述目标比例与第二预设阈值;
181.若同一标签类型下的特征标签所对应的标签方差均小于所述第一预设阈值,及同一标签类型下的特征标签所对应的目标比例均大于所述第二预设阈值,则从该标签类型的特征标签中选取所述标签方差最大及/或所述目标比例最小所对应的特征标签作为所述目标标签;或者
182.若同一标签类型下的特征标签所对应的标签方差不都小于所述第一预设阈值,则从该特征标签的特征标签中选取所述标签方差大于或者等于所述第一预设阈值的特征标签作为所述目标标签;或者
183.若同一标签类型下的特征标签所对应的目标比例不都大于所述第二预设阈值,则从该特征标签的特征标签中选取所述目标比例小于或者等于所述第二预设阈值的特征标签作为所述目标标签。
184.在本发明的至少一个实施例中,所述输入单元112,还用于识别出所述训练信息的信息类型;
185.基于预设编码表对所述信息类型为字符型的训练信息进行编码处理,得到第一编码,并对所述训练文本进行编码处理,得到第二编码;
186.将所述信息类型为数值型的训练信息进行数值转换,得到数值分布信息;
187.对所述数值分布信息进行标准化处理,得到第三编码;
188.拼接所述第一编码、所述第二编码及所述第三编码,得到目标编码;
189.根据所述多个行为预测模型对所述目标编码进行处理,得到所述预测行为结果。
190.在本发明的至少一个实施例中,所述多个行为预测模型包括以下至少一个模型的组合:
191.基于随机森林算法的行为预测模型、基于梯度提升决策树的行为预测模型、基于逻辑回归算法的行为预测模型、基于极致梯度提升的行为预测模型。
192.在本发明的至少一个实施例中,所述多个模型指标包括第一指标、第二指标、第三指标及第四指标,所述生成单元113,还用于对于每个行为预测模型,统计所述预测行为结果及所述用户行为结果均为第一配置结果的训练用户的用户数量作为第一数量,并统计所述预测行为结果及所述用户行为结果均为第二配置结果的训练用户的用户数量作为第二数量;
193.统计所述预测行为结果为所述第一配置结果及所述用户行为结果为所述第二配置结果的训练用户的用户数量作为第三数量,并统计所述预测行为结果为所述第二配置结
果及所述用户行为结果为所述第一配置结果的训练用户的用户数量作为第四数量;
194.根据所述第一数量及所述第四数量生成所述第一指标,并根据所述第一数量及所述第三数量生成所述第二指标;
195.根据所述第一数量、所述第二数量、所述第三数量及所述第四数量生成第三指标,并根据所述第一指标及所述第二指标生成所述第四指标。
196.在本发明的至少一个实施例中,所述第一指标的生成公式为:
197.所述第二指标的生成公式为:
198.所述第三指标的生成公式为:
199.所述第四指标的生成公式为:
200.其中,k1表示所述第一指标,k2表示所述第二指标,k3表示所述第三指标,k4表示所述第四指标,a表示第一数量,b表示第二数量,c表示第三数量,d表示第四数量,z表示预设常数。
201.在本发明的至少一个实施例中,所述基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果包括:
202.解析所述用户行为预测请求的请求报文,得到所述请求报文携带的数据信息;
203.从所述数据信息中提取所述测试用户的用户标识;
204.基于所述用户标识及所述目标标签生成查询语句;
205.基于配置信息库,运行所述查询语句,得到所述用户信息;
206.从所述数据信息中的路径地址中定位出所述测试文本;
207.对所述用户信息及所述测试文本进行信息编码,得到输入向量;
208.根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果。
209.在本发明的至少一个实施例中,所述目标模型包括正向网络层、反向网络层及多个预测分析树,所述根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果包括:
210.基于所述正向网络层对所述输入向量进行特征提取,得到第一特征,并基于所述反向网络层对所述输入向量进行特征提取,得到第二特征;
211.根据所述第一特征及所述第二特征生成所述输入向量的目标特征;
212.从每个预测分析树中获取出与所述目标特征相匹配的匹配结果;
213.统计每个匹配结果的结果数量,并将所述结果数量最大的匹配结果确定为所述目标行为结果。
214.由以上技术方案可以看出,本技术通过对所述多个特征标签进行特征分析,能够合理的筛选出所述目标标签,由于减少对所述多个特征标签的分析,因此能够提高行为预测分析效率,通过将所述训练信息输入至所述多个行为预测模型中进行分析,并结合所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标,进而根据所述多个模型指标,能够从所述多个行为预测模型中准确的筛选出目标模型,提高所述目标模型对
行为预测的准确性,因此,本技术能够提高所述目标行为结果的识别准确性及识别效率。
215.如图4所示,是本发明实现用户行为预测方法的较佳实施例的电子设备的结构示意图。
216.在本发明的一个实施例中,所述电子设备1包括,但不限于,存储器12、处理器13,以及存储在所述存储器12中并可在所述处理器13上运行的计算机可读指令,例如用户行为预测程序。
217.本领域技术人员可以理解,所述示意图仅仅是电子设备1的示例,并不构成对电子设备1的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如所述电子设备1还可以包括输入输出设备、网络接入设备、总线等。
218.所述处理器13可以是中央处理单元(central processing unit,cpu),还可以是其他通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等,所述处理器13是所述电子设备1的运算核心和控制中心,利用各种接口和线路连接整个电子设备1的各个部分,及执行所述电子设备1的操作系统以及安装的各类应用程序、程序代码等。
219.示例性的,所述计算机可读指令可以被分割成一个或多个模块/单元,所述一个或者多个模块/单元被存储在所述存储器12中,并由所述处理器13执行,以完成本发明。所述一个或多个模块/单元可以是能够完成特定功能的一系列计算机可读指令段,该计算机可读指令段用于描述所述计算机可读指令在所述电子设备1中的执行过程。例如,所述计算机可读指令可以被分割成筛选单元110、获取单元111、输入单元112、生成单元113及预测单元114。
220.所述存储器12可用于存储所述计算机可读指令和/或模块,所述处理器13通过运行或执行存储在所述存储器12内的计算机可读指令和/或模块,以及调用存储在存储器12内的数据,实现所述电子设备1的各种功能。所述存储器12可主要包括存储程序区和存储数据区,其中,存储程序区可存储操作系统、至少一个功能所需的应用程序(比如声音播放功能、图像播放功能等)等;存储数据区可存储根据电子设备的使用所创建的数据等。存储器12可以包括非易失性和易失性存储器,例如:硬盘、内存、插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)、至少一个磁盘存储器件、闪存器件、或其他存储器件。
221.所述存储器12可以是电子设备1的外部存储器和/或内部存储器。进一步地,所述存储器12可以是具有实物形式的存储器,如内存条、tf卡(trans-flash card)等等。
222.所述电子设备1集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机可读指令来指令相关的硬件来完成,所述的计算机可读指令可存储于一计算机可读存储介质中,该计算机可读指令在被处理器执行时,可实现上述各个方法实施例的步骤。
223.其中,所述计算机可读指令包括计算机可读指令代码,所述计算机可读指令代码
可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可以包括:能够携带所述计算机可读指令代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)。
224.本发明所指区块链是分布式用户行为预测、点对点传输、共识机制、加密算法等计算机技术的新型应用模式。区块链(blockchain),本质上是一个去中心化的数据库,是一串使用密码学方法相关联产生的数据块,每一个数据块中包含了一批次网络交易的信息,用于验证其信息的有效性(防伪)和生成下一个区块。区块链可以包括区块链底层平台、平台产品服务层以及应用服务层等。
225.结合图1,所述电子设备1中的所述存储器12存储计算机可读指令实现一种用户行为预测方法,所述处理器13可执行所述计算机可读指令从而实现:
226.从获取到的多个特征标签中筛选出目标标签;
227.获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本;
228.将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果;
229.根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标;
230.基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型;
231.响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。
232.具体地,所述处理器13对上述计算机可读指令的具体实现方法可参考图1对应实施例中相关步骤的描述,在此不赘述。
233.在本发明所提供的几个实施例中,应该理解到,所揭露的系统,装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述模块的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式。
234.所述计算机可读存储介质上存储有计算机可读指令,其中,所述计算机可读指令被处理器13执行时用以实现以下步骤:
235.从获取到的多个特征标签中筛选出目标标签;
236.获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本;
237.将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果;
238.根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标;
239.基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型;
240.响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。
241.所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显
示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例方案的目的。
242.另外,在本发明各个实施例中的各功能模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用硬件加软件功能模块的形式实现。
243.因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附关联图标记视为限制所涉及的权利要求。
244.此外,显然“包括”一词不排除其他单元或步骤,单数不排除复数。所述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一、第二等词语用来表示名称,而并不表示任何特定的顺序。
245.最后应说明的是,以上实施例仅用以说明本发明的技术方案而非限制,尽管参照较佳实施例对本发明进行了详细说明,本领域的普通技术人员应当理解,可以对本发明的技术方案进行修改或等同替换,而不脱离本发明技术方案的精神和范围。

技术特征:
1.一种用户行为预测方法,其特征在于,所述用户行为预测方法包括:从获取到的多个特征标签中筛选出目标标签;获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本;将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果;根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标;基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型;响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。2.如权利要求1所述的用户行为预测方法,其特征在于,所述从获取到的多个特征标签中筛选出目标标签包括:获取每个特征标签的特征信息及所述特征信息所对应的特征结果;根据所述特征信息,计算每个特征标签的标签方差;统计取值相同的特征信息所对应的结果不同的特征结果的信息数量,并统计每个特征标签中所述特征信息的特征总量;根据所述信息数量及所述特征总量,计算每个特征标签的目标比例;识别每个特征标签所对应的标签类型;根据所述标签方差、所述目标比例及所述标签类型,从所述多个特征标签中筛选出所述目标标签。3.如权利要求2所述的用户行为预测方法,其特征在于,所述根据所述标签方差、所述目标比例及所述标签类型,从所述多个特征标签中筛选出所述目标标签包括:比较所述标签方差与第一预设阈值,并比较所述目标比例与第二预设阈值;若同一标签类型下的特征标签所对应的标签方差均小于所述第一预设阈值,及同一标签类型下的特征标签所对应的目标比例均大于所述第二预设阈值,则从该标签类型的特征标签中选取所述标签方差最大及/或所述目标比例最小所对应的特征标签作为所述目标标签;或者若同一标签类型下的特征标签所对应的标签方差不都小于所述第一预设阈值,则从该特征标签的特征标签中选取所述标签方差大于或者等于所述第一预设阈值的特征标签作为所述目标标签;或者若同一标签类型下的特征标签所对应的目标比例不都大于所述第二预设阈值,则从该特征标签的特征标签中选取所述目标比例小于或者等于所述第二预设阈值的特征标签作为所述目标标签。4.如权利要求1所述的用户行为预测方法,其特征在于,所述将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果包括:识别出所述训练信息的信息类型;基于预设编码表对所述信息类型为字符型的训练信息进行编码处理,得到第一编码,并对所述训练文本进行编码处理,得到第二编码;将所述信息类型为数值型的训练信息进行数值转换,得到数值分布信息;
对所述数值分布信息进行标准化处理,得到第三编码;拼接所述第一编码、所述第二编码及所述第三编码,得到目标编码;根据所述多个行为预测模型对所述目标编码进行处理,得到所述预测行为结果。5.如权利要求1所述的用户行为预测方法,其特征在于,所述多个模型指标包括第一指标、第二指标、第三指标及第四指标,所述根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标包括:对于每个行为预测模型,统计所述预测行为结果及所述用户行为结果均为第一配置结果的训练用户的用户数量作为第一数量,并统计所述预测行为结果及所述用户行为结果均为第二配置结果的训练用户的用户数量作为第二数量;统计所述预测行为结果为所述第一配置结果及所述用户行为结果为所述第二配置结果的训练用户的用户数量作为第三数量,并统计所述预测行为结果为所述第二配置结果及所述用户行为结果为所述第一配置结果的训练用户的用户数量作为第四数量;根据所述第一数量及所述第四数量生成所述第一指标,并根据所述第一数量及所述第三数量生成所述第二指标;根据所述第一数量、所述第二数量、所述第三数量及所述第四数量生成第三指标,并根据所述第一指标及所述第二指标生成所述第四指标。6.如权利要求1所述的用户行为预测方法,其特征在于,所述基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果包括:解析所述用户行为预测请求的请求报文,得到所述请求报文携带的数据信息;从所述数据信息中提取所述测试用户的用户标识;基于所述用户标识及所述目标标签生成查询语句;基于配置信息库,运行所述查询语句,得到所述用户信息;从所述数据信息中的路径地址中定位出所述测试文本;对所述用户信息及所述测试文本进行信息编码,得到输入向量;根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果。7.如权利要求6所述的用户行为预测方法,其特征在于,所述目标模型包括正向网络层、反向网络层及多个预测分析树,所述根据所述目标模型对所述输入向量进行预测分析,得到所述目标行为结果包括:基于所述正向网络层对所述输入向量进行特征提取,得到第一特征,并基于所述反向网络层对所述输入向量进行特征提取,得到第二特征;根据所述第一特征及所述第二特征生成所述输入向量的目标特征;从每个预测分析树中获取出与所述目标特征相匹配的匹配结果;统计每个匹配结果的结果数量,并将所述结果数量最大的匹配结果确定为所述目标行为结果。8.一种用户行为预测装置,其特征在于,所述用户行为预测装置包括:筛选单元,用于从获取到的多个特征标签中筛选出目标标签;获取单元,用于获取多个训练用户在所述目标标签上的训练信息及用户行为结果,并获取训练文本;
输入单元,用于将所述训练信息及所述训练文本输入至预先训练完成的多个行为预测模型中,得到每个行为预测模型对所述多个训练用户的预测行为结果;生成单元,用于根据所述用户行为结果及所述预测行为结果生成每个行为预测模型的模型指标;所述筛选单元,还用于基于多个所述模型指标,从所述多个行为预测模型中筛选出目标模型;预测单元,用于响应于用户行为预测请求,基于所述目标模型对所述用户行为预测请求中测试用户的用户信息及测试文本进行预测处理,得到所述测试用户对所述测试文本的目标行为结果。9.一种电子设备,其特征在于,所述电子设备包括:存储器,存储有计算机可读指令;及处理器,执行所述存储器中存储的计算机可读指令以实现如权利要求1至7中任意一项所述的用户行为预测方法。10.一种计算机可读存储介质,其特征在于:所述计算机可读存储介质中存储有计算机可读指令,所述计算机可读指令被电子设备中的处理器执行以实现如权利要求1至7中任意一项所述的用户行为预测方法。

技术总结
本发明涉及人工智能及金融领域,提供一种用户行为预测方法、装置、设备及存储介质。该方法从获取到的多个特征标签中筛选出目标标签,获取多个训练用户在目标标签上的训练信息及用户行为结果,将训练信息及训练文本输入至多个行为预测模型中,得到每个行为预测模型对多个训练用户的预测行为结果,根据用户行为结果及预测行为结果生成模型指标,并筛选出目标模型,响应于用户行为预测请求,基于目标模型对测试用户的用户信息及测试文本进行预测处理,能够准确的得到目标行为结果。此外,本发明还涉及区块链技术,所述目标行为结果可存储于区块链中。块链中。块链中。


技术研发人员:刘巍
受保护的技术使用者:平安科技(深圳)有限公司
技术研发日:2023.05.24
技术公布日:2023/8/24
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐