针对消费数据的隐私保护循环神经网络评估方法及装置与流程
未命名
09-22
阅读:53
评论:0
1.本发明涉及数据加密技术领域,尤其涉及针对消费数据的隐私保护循环神经网络评估方法及装置。
背景技术:
2.金融行业通常需要对客户进行信贷风险评估,以便为客户提供贷款或融资支持。客户的消费数据包含了客户的个人隐私信息,上述征信机构、电信机构、互联网企业和政府等机构使用客户消费数据之前,应征得客户的数据使用授权,并在数据隐私保护的前提下使用客户消费数据。目前的方法要么关注于数据授权访问,或者直接使用客户消费数据,没有关注两者结合下的实现,即客户授权使用数据,并在密文下使用客户的消费数据,最后只有在客户授权解密使用后的结果情况下,其他机构才可以获得使用结果的明文数据。
3.现在,机器学习技术已经应用到信贷风险评估场景中,其中一种方法是使用循环神经网络模型,通过已有数据对客户进行评估。然而,这种方法只考虑了单一机构内的消费数据,而忽略了其他机构中客户产生的信用消费数据、通信缴费数据、电子消费数据和政府消费信息,这些数据对客户的信贷风险评估也非常有用。因此,使用多机构消费数据可以提高信贷风险评估的准确性。但是,在融合多机构数据进行信贷风险评估时,需要保护客户消费数据的隐私以及各机构的信贷风险评估模型和评估结果的隐私,以遵守数据隐私保护法律法规。
技术实现要素:
4.本发明的目的是为了至少解决现有技术的不足之一,提供针对消费数据的隐私保护循环神经网络评估方法及装置。
5.为了实现上述目的,本发明采用以下的技术方案:
6.具体的,提出针对消费数据的隐私保护循环神经网络评估方法,包括以下:
7.银行服务器获取用户的评估请求,并向多个持有用户消费数据的机构服务器请求获取用户消费数据;
8.多个持有用户消费数据的机构服务器向用户发出数据使用授权请求;
9.用户授权多个所述机构服务器在数据由用户公钥加密情况下下使用其数据,并公开用户公钥;
10.多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,并将所述加密结果发送至银行服务器;
11.银行服务器以所述加密结果作为输入,执行循环神经网络,输出加密的评估结果,并将所述评估结果反馈至用户;
12.用户通过其公钥对应的私钥对加密的所述评估结果进行解密得到解密的评估结果。
13.进一步,具体的,多个所述机构服务器基于用户的所述公钥加密其持有的用户消
费数据得到加密结果,包括,
14.每一机构服务器执行如下过程,
15.从用户消费数据中筛选出隐私敏感词汇并进行标记;
16.通过词向量化方法将用户消费数据从文本类型数据转换成浮点类型数值矩阵数据;
17.将浮点类型数值矩阵数据转换为整数类型数值矩阵数据;
18.通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据,剩余的数值矩阵数据保持明文不变,得到加密结果。
19.进一步,具体的,所述循环神经网络采用二次多项式函数替换激活层的运算,且所述循环神经网络对加密结果中通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据后的数据,执行密文下乘法深度为1的计算。
20.本发明还提出针对消费数据的隐私保护循环神经网络评估装置,包括以下:
21.银行服务器,用于获取用户的评估请求,向多个持有用户消费数据的机构服务器请求获取用户消费数据,并在接收到加密数据后,以所述加密结果作为输入,执行循环神经网络,输出加密的评估结果,并将所述评估结果反馈至用户;
22.多个持有用户消费数据的机构服务器,用于向用户发出数据使用授权请求,并在用户授权多个所述机构服务器在数据由用户公钥加密情况下下使用其数据,且公开用户公钥后,基于用户的所述公钥加密其持有的用户消费数据得到加密结果,将所述加密结果发送至所述银行服务器;
23.解密模块,用于使用户通过其公钥对应的私钥对加密的所述评估结果进行解密得到解密的评估结果。
24.进一步,具体的,多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,包括,
25.每一机构服务器执行如下过程,
26.从用户消费数据中筛选出隐私敏感词汇并进行标记;
27.通过词向量化方法将用户消费数据从文本类型数据转换成浮点类型数值矩阵数据;
28.将浮点类型数值矩阵数据转换为整数类型数值矩阵数据;
29.通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据,剩余的数值矩阵数据保持明文不变,得到加密结果。
30.进一步,具体的,所述循环神经网络采用二次多项式函数替换激活层的运算,且所述循环神经网络的输入为加密结果中通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据后的数据,执行密文下乘法深度为1的计算。
31.本发明还提出一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述针对消费数据的隐私保护循环神经网络评估方法的步骤。
32.本发明的有益效果为:
33.本发明提供的针对消费数据的隐私保护循环神经网络评估方法,多个持有客户消费数据的机构服务器向客户发出数据使用授权请求,客户授权多个机构服务器在数据加密
情形下使用其数据,并公开客户的公钥;多个机构服务器使用客户的公钥加密本地服务器的客户消费数据,并将加密结果发送给银行,输入循环神经网络进行评估,输出关于该客户的信贷风险评估结果的密文,发送给客户;客户使用公钥对应的私钥,解密银行返回的信贷风险评估结果,客户可以选择性地将信贷风险评估结果共享给银行及其他机构。本发明能够在信贷风险评估的过程中在数据隐私保护的前提下使用客户消费数据,并综合考虑了用户的多方消费数据,评估结果准确且隐私安全性高。
附图说明
34.通过对结合附图所示出的实施方式进行详细说明,本公开的上述以及其他特征将更加明显,本公开附图中相同的参考标号表示相同或相似的输出电压,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图,在附图中:
35.图1所示为本发明针对消费数据的隐私保护循环神经网络评估方法的流程图;
36.图2所示为本发明针对消费数据的隐私保护循环神经网络评估方法的多方交互示意图;
37.图3所示为本发明本发明针对消费数据的隐私保护循环神经网络评估方法的一个实例中所使用的循环神经网络模型示意图。
具体实施方式
38.以下将结合实施例和附图对本发明的构思、具体结构及产生的技术效果进行清楚、完整的描述,以充分地理解本发明的目的、方案和效果。需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。附图中各处使用的相同的附图标记指示相同或相似的部分。
39.参照图1以及图2,实施例1,本发明提出针对消费数据的隐私保护循环神经网络评估方法,包括以下:
40.步骤110、银行服务器获取用户的评估请求,并向多个持有用户消费数据的机构服务器请求获取用户消费数据;
41.步骤120、多个持有用户消费数据的机构服务器向用户发出数据使用授权请求;
42.步骤130、用户授权多个所述机构服务器在数据由用户公钥加密情况下下使用其数据,并公开用户公钥;
43.步骤140、多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,并将所述加密结果发送至银行服务器;
44.步骤150、银行服务器以所述加密结果作为输入,执行循环神经网络,输出加密的评估结果,并将所述评估结果反馈至用户;
45.步骤160、用户通过其公钥对应的私钥对加密的所述评估结果进行解密得到解密的评估结果。得到的评估结果用户可以选择性的将其共享给银行及其他结构。
46.在本实施例中,多个机构服务器使用客户的公钥加密客户的消费数据,并利用密文同态特性执行密文下的循环神经网络评估过程。特别地,由于当前支持任意多次加法、乘法密文运算的全同态加密算法都是基于格理论而构造,这种加密算法映射明文到环域密文
空间,密文为较大维度的整数系数多项式,因而密文空间的加法、乘法运算为这类多项式的加法、乘法运算。一个计算对应的密文乘法运算复杂度极大程度上决定了该计算的效率,而循环神经网络常涉及包括乘法和加法的计算。因此,即使加密算法支持任意次数的乘法运算,也会因为计算复杂度大而难以实际应用。于是本方法以降低两个密文相乘运算次数,从而减低总体计算的乘法深度为目的,结合循环神经网络以时序性数据作为输入的特点,只加密隐私敏感明文对应的时序数据,而不是所有数据。另外,消费数据通常是文本类型数据,全同态加密算法通常在环域上进行安全操作,如整数环,因此,本方法先将文本类型数据转为浮点类型数据,再转化为域上的整数类型数据。
47.全同态加密算法:该算法同时支持加法和乘法同态加密,第一个全同态加密算法于2009年由craig gentry构造,此后许多学者基于gentry所提出的算法构造更高效的全同态加密算法。全同加密算法的加法和乘法同态特性可分别表示为态加密算法。全同加密算法的加法和乘法同态特性可分别表示为其中x,y表示两个输入。
48.作为本发明的优选实施方式,具体的,多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,包括,
49.每一机构服务器执行如下过程,
50.从用户消费数据中筛选出隐私敏感词汇并进行标记;
51.通过词向量化方法将用户消费数据从文本类型数据转换成浮点类型数值矩阵数据;
52.将浮点类型数值矩阵数据转换为整数类型数值矩阵数据;
53.通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据,剩余的数值矩阵数据保持明文不变,得到加密结果。
54.具体的,所述循环神经网络采用二次多项式函数替换激活层的运算,且所述循环神经网络对加密结果中通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据后的数据,执行密文下乘法深度为1的计算。
55.银行将客户的加密数值矩阵数据和未加密的数值矩阵数据依次输入到本地用于信贷风险评估的循环神经网络中,利用全同态加密算法支持密文同态计算的性质完成密文数据上的信贷风险评估,最后输出加密的信贷风险评估结果。该加密评估结果只有拥有解密密钥的客户可以解密。由于循环神经网络模型评估时不仅涉及线性计算也包含非线性计算(如激活函数),密文下的非线性计算不能适用于全同态加密算法,因此,对于循环神经网络的激活层,本方法采用二次多项式函数替换激活层的运算,以使整个循环神经网络模型评估时所有的运算适用于全同态加密算法。循环神经网络评估过程执行结束后,输出加密的评估结果密文,银行将该评估结果密文返回给客户。
56.具体的,在一个应用实例中,
57.a21:每一机构服务器加密客户消费数据之前,先从消费数据中筛选出隐私敏感词汇。譬如,文本消费记录“transaction date:04/15/2023;transaction description:payment-john smith;transaction type:debit;transaction amount:$100.00;account balance:$1,500.00;fees and charges:$0.00;interest earned:$0.50;account number:xxxx-xxxx-xxxx-1234;
58.account holder information:jane doe,jdoe@email.com,123main st,
anytown,usa”中的交易余额(account balance)、账户号(account number)、账户持有者信息(account holder information)属于隐私敏感词汇。客户在词向量化之前先从文本中选择出隐私敏感词汇如“account balance”、“account number”和“account holder information”的信息。在词向量化之后,文本数据转化为如下矩阵:
[0059][0060]
客户只加密对应于隐私敏感词汇的数值型矩阵数据,如而对应于非隐私敏感词汇的数值型矩阵数据保持不变。上述矩阵变为如下的矩阵:
[0061][0062]
a22:银行将客户的加密数值型矩阵数据和未加密的数值型矩阵数据依次输入到本地用于信贷风险评估的循环神经网络,最后输出关于该客户的信贷风险评估结果的密文。定义一个循环神经网络模型如图3,图3中,输入层表示序列时刻的输入特征x
t
,x
t+1
,x
t+2
等,s
t-1
,s
t
,s
t+1
是序列时刻对应的状态信息,u和w分别表示输入状态和前一时刻状态的模型参数权重,v则是输出状态的模型参数权重。σh(
·
)是循环神经网络模型的隐含层的函数,σo(
·
)是激活层函数,o
t
,o
t+1
,o
t+2
则表示序列输出结果。例如,o
t+2
经过以下式子计算才获得:
[0063]ot+2
=σo(vs
t+2
)=σo(vσh(ux
t+1
+ws
t+1
))=σo(vσh(ux
t+1
+wσh(ux
t
+ws
t-1
))).
[0064]
由于循环神经网络模型评估时不仅涉及线性计算也包含非线性计算(如激活函数σo(
·
)),密文下的非线性计算不能适用于全同态加密算法,因此,对于循环神经网络的激活层,本方法采用二次多项式函数替换激活层的运算,以使整个循环神经网络模型评估时所有的运算适用于全同态加密算法。将上述式子转化为以下式子:
[0065]ot+2
=(vs
t+2
)2=(v(ux
t+1
+ws
t+1
)2)2=(v(ux
t+1
+w(ux
t
+ws
t-1
)2)2)2.
[0066]
另外,由于本方法只加密与敏感文本相关的数据,而不是加密所有数据,从而降低两个密文相乘运算次数,并减少总体计算的乘法深度。以下对比只加密上述图中x
i+2
的计算和加密x
i+2
、x
i+i
、xi的计算所造成的乘法深度。
[0067]
首先,只加密x
i+2
的计算如下:
[0068]ot+2
=(v(u
·
enc(x
i+2
)+w
·
(u
·
x
i+1
+w
·
(u
·
xi+
…
)2)2)2)2[0069]
=v2(u
·
enc(x
i+2
)2+2
×
v(u
·
enc(x
i+2
)
[0070]
×w·
(u
·
x
i+1
+w
·
(u
·
xi+
…
)2)2)2[0071]
+(w
·
(u
·
x
i+1
+w
·
(u
·
xi+
…
)2)2)2)2.
[0072]
上述式子的乘法深度为1。
[0073]
第二,加密x
i+2
、x
i+1
、xi的计算如下:
[0074]ot+2
=(v(u
·
enc(x
i+2
)+w
·
(u
·
enc(x
i+1
)+w
·
(u
·
enc(xi)+
…
)2)2)2)2.
[0075]
上述式子的乘法深度大于1。
[0076]
因此,只加密与敏感文本相关的数据而不是加密所有数据,可以减少循环神经网络评估过程的乘法深度。
[0077]
本发明还提出针对消费数据的隐私保护循环神经网络评估装置,包括以下:
[0078]
银行服务器,用于获取用户的评估请求,向多个持有用户消费数据的机构服务器请求获取用户消费数据,并在接收到加密数据后,以所述加密结果作为输入,执行循环神经网络,输出加密的评估结果,并将所述评估结果反馈至用户;
[0079]
多个持有用户消费数据的机构服务器,用于向用户发出数据使用授权请求,并在用户授权多个所述机构服务器在数据由用户公钥加密情况下下使用其数据,且公开用户公钥后,基于用户的所述公钥加密其持有的用户消费数据得到加密结果,将所述加密结果发送至所述银行服务器;
[0080]
解密模块,用于使用户通过其公钥对应的私钥对加密的所述评估结果进行解密得到解密的评估结果。
[0081]
作为本发明的优选实施方式,具体的,多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,包括,
[0082]
每一机构服务器执行如下过程,
[0083]
从用户消费数据中筛选出隐私敏感词汇并进行标记;
[0084]
通过词向量化方法将用户消费数据从文本类型数据转换成浮点类型数值矩阵数据;
[0085]
将浮点类型数值矩阵数据转换为整数类型数值矩阵数据;
[0086]
通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据,剩余的数值矩阵数据保持明文不变,得到加密结果。
[0087]
作为本发明的优选实施方式,具体的,所述循环神经网络采用二次多项式函数替换激活层的运算,且所述循环神经网络的输入为加密结果中通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据后的数据,执行乘法深度为1的计算。
[0088]
本发明还提出一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,所述计算机程序被处理器执行时实现如所述针对消费数据的隐私保护循环神经网络评估方法的步骤。
[0089]
所述作为分离部件说明的模块可以是或者也可以不是物理上分开的,作为模块显示的部件可以是或者也可以不是物理模块,即可以位于一个地方,或者也可以分布到多个网络模块上。可以根据实际的需要选择其中的部分或者全部模块来实现本实施例中的方案的目的。
[0090]
另外,在本发明各个实施例中的各功能模块可以集成在一个处理模块中,也可以是各个模块单独物理存在,也可以两个或两个以上模块集成在一个模块中。上述集成的模块既可以采用硬件的形式实现,也可以采用软件功能模块的形式实现。
[0091]
所述集成的模块如果以软件功能模块的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一计算机可读存储的介质中,该计算机程序在被处理器执行时,可实现上述各个方法实施例的步骤。其中,所述计算机程序包括计算机程序代码,所述计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。所述计算机可读介质可
以包括:能够携带所述计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、电载波信号、电信信号以及软件分发介质等。
[0092]
尽管本发明的描述已经相当详尽且特别对几个所述实施例进行了描述,但其并非旨在局限于任何这些细节或实施例或任何特殊实施例,而是应当将其视作是通过参考所附权利要求考虑到现有技术为这些权利要求提供广义的可能性解释,从而有效地涵盖本发明的预定范围。此外,上文以发明人可预见的实施例对本发明进行描述,其目的是为了提供有用的描述,而那些目前尚未预见的对本发明的非实质性改动仍可代表本发明的等效改动。
[0093]
以上所述,只是本发明的较佳实施例而已,本发明并不局限于上述实施方式,只要其以相同的手段达到本发明的技术效果,都应属于本发明的保护范围。在本发明的保护范围内其技术方案和/或实施方式可以有各种不同的修改和变化。
技术特征:
1.针对消费数据的隐私保护循环神经网络评估方法,其特征在于,包括以下:银行服务器获取用户的评估请求,并向多个持有用户消费数据的机构服务器请求获取用户消费数据;多个持有用户消费数据的机构服务器向用户发出数据使用授权请求;用户授权多个所述机构服务器在数据由用户公钥加密情况下使用其数据,并公开用户公钥;多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,并将所述加密结果发送至银行服务器;银行服务器以所述加密结果作为输入,执行循环神经网络,输出加密的评估结果,并将所述评估结果反馈至用户;用户通过其公钥对应的私钥对加密的所述评估结果进行解密得到解密的评估结果。2.根据权利要求1所述的针对消费数据的隐私保护循环神经网络评估方法,其特征在于,具体的,多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,包括,每一机构服务器执行如下过程,从用户消费数据中筛选出隐私敏感词汇并进行标记;通过词向量化方法将用户消费数据从文本类型数据转换成浮点类型数值矩阵数据;将浮点类型数值矩阵数据转换为整数类型数值矩阵数据;通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据,剩余的数值矩阵数据保持明文不变,得到加密结果。3.根据权利要求2所述的针对消费数据的隐私保护循环神经网络评估方法,其特征在于,具体的,所述循环神经网络采用二次多项式函数替换激活层的运算,且所述循环神经网络对加密结果中通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据后的数据,执行密文下乘法深度为1的计算。4.针对消费数据的隐私保护循环神经网络评估装置,其特征在于,包括以下:银行服务器,用于获取用户的评估请求,向多个持有用户消费数据的机构服务器请求获取用户消费数据,并在接收到加密数据后,以所述加密结果作为输入,执行循环神经网络,输出加密的评估结果,并将所述评估结果反馈至用户;多个持有用户消费数据的机构服务器,用于向用户发出数据使用授权请求,并在用户授权多个所述机构服务器在数据由用户公钥加密情况下下使用其数据,且公开用户公钥后,基于用户的所述公钥加密其持有的用户消费数据得到加密结果,将所述加密结果发送至所述银行服务器;解密模块,用于使用户通过其公钥对应的私钥对加密的所述评估结果进行解密得到解密的评估结果。5.根据权利要求4所述的针对消费数据的隐私保护循环神经网络评估装置,其特征在于,具体的,多个所述机构服务器基于用户的所述公钥加密其持有的用户消费数据得到加密结果,包括,每一机构服务器执行如下过程,从用户消费数据中筛选出隐私敏感词汇并进行标记;
通过词向量化方法将用户消费数据从文本类型数据转换成浮点类型数值矩阵数据;将浮点类型数值矩阵数据转换为整数类型数值矩阵数据;通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据,剩余的数值矩阵数据保持明文不变,得到加密结果。6.根据权利要求5所述的针对消费数据的隐私保护循环神经网络评估装置,其特征在于,具体的,所述循环神经网络采用二次多项式函数替换激活层的运算,且所述循环神经网络的输入为加密结果中通过用户的所述公钥即加密密钥pk加密标记的隐私敏感词汇所对应的整数类型数值矩阵数据后的数据,执行密文下乘法深度为1的计算。7.一种计算机可读存储的介质,所述计算机可读存储的介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-3中任一项所述方法的步骤。
技术总结
本发明涉及针对消费数据的隐私保护循环神经网络评估方法,多个持有客户消费数据的机构服务器向客户发出数据使用授权请求,客户授权多个机构服务器在数据加密情形下使用其数据,并公开客户的公钥;多个机构服务器使用客户的公钥加密本地服务器的客户消费数据,并将加密结果发送给银行,输入循环神经网络进行评估,输出关于该客户的信贷风险评估结果的密文,发送给客户;客户使用公钥对应的私钥,解密银行返回的信贷风险评估结果,客户可以选择性地将信贷风险评估结果共享给银行及其他机构。本发明能够在信贷风险评估的过程中在数据隐私保护的前提下使用客户消费数据,并综合考虑了用户的多方消费数据,评估结果准确且隐私安全性高。全性高。全性高。
技术研发人员:黄文喜 林吉达 曾立波 田新军 童画 陈聪
受保护的技术使用者:广州芳禾数据有限公司
技术研发日:2023.06.21
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/