区域常驻用户识别方法、装置、设备及存储介质与流程
未命名
10-25
阅读:65
评论:0
1.本发明涉及计算机技术领域,尤其涉及一种区域常驻用户识别方法、装置、设备及存储介质。
背景技术:
2.近年来,各监管部门出台政策指导金融系统优化资源配置,精准发力、靠前发力,切实加大“三农”领域金融支持,接续全面推进乡村振兴。各银行业金融机构要围绕高标准农田建设、春耕备耕、粮食流通收储加工等全产业链,主动对接融资需求,强化粮食安全金融保障。在用户申请乡村振兴或惠农信贷产品过程中,需要对农村常驻用户进行识别,以保证资金真正投入到乡村振兴领域。当前识别技术方案多集中在单方面使用征信及机构登记数据,使用权威机构证明,或单独使用用户轨迹数据,建模后确认用户是否为农村常驻用户,以进行下一步风控校验手段。
3.现有的识别技术方案使用征信数据或权威机构证明数据缺乏时效性,数据更新慢,无法保证当前用户在目标区域的常驻时间;仅使用用户轨迹数据有身份冒用问题,无法保证身份数据与人员的真实对应;使用单领域数据用户常驻地点类别识别精度较低,对资金的最终去向无法很好保证;传统的使用多方数据的建模过程数据存在泄漏及滥用风险。
技术实现要素:
4.本发明的主要目的在于提供一种区域常驻用户识别方法、装置、设备及存储介质,旨在解决对区域常驻用户的识别精准度低的问题。
5.为实现上述目的,本发明提供一种区域常驻用户识别方法,所述区域常驻用户识别方法包括以下步骤:
6.接收待识别用户业务数据;
7.将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。
8.可选地,所述接收待识别用户业务数据的步骤之前,还包括:
9.基于隐私集合求交技术、所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型。
10.可选地,所述基于隐私集合求交技术、所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型的步骤包括:
11.基于所述隐私集合求交技术,构建目标用户业务数据训练集,所述目标用户业务数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据;
12.基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型;
13.基于所述纵向联邦学习技术及逻辑回归算法,通过所述第二方目标用户业务数据更新第二方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第二方区域常驻用户识别模型。
14.可选地,所述基于所述隐私集合求交技术,构建目标用户业务数据训练集的步骤包括:
15.获取用户身份数据,所述用户身份数据包括第一方用户身份数据和第二方用户身份数据;
16.通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息;
17.根据所述目标用户身份信息,获取所述第一方目标用户业务数据和第二方目标用户业务数据,建立所述目标用户业务数据训练集。
18.可选地,所述通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息的步骤包括:
19.基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服务器,获取第一方目标用户身份信息;
20.基于所述隐私集合求交技术,根据所述第二方用户身份数据,通过所述数据对齐服务器中的第二方数据对齐服务器,获取第二方目标用户身份信息;
21.根据所述第一方目标用户身份信息和第二方目标用户身份信息,得到所述目标用户身份信息。
22.可选地,所述基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服务器,获取第一方目标用户身份信息的步骤包括:
23.将数据对齐加密条件和所述第一方用户身份数据输入所述第一方数据对齐服务器;
24.根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第一方用户身份数据进行加密,生成第一方第一加密用户身份数据;
25.通过所述第一方数据对齐服务器,将第一方第一加密用户身份数据发送到所述第二方数据对齐服务器;
26.通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第二方第一加密用户身份数据;
27.根据所述第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。
28.可选地,所述根据所述第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息的步骤包括:
29.根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第二方第一加密用户身份数据进行加密,生成第二方第二加密用户身份数据;
30.通过所述第一方数据对齐服务器,将所述第二方第二加密用户身份数据发送到所述第二方数据对齐服务器;
31.通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第一方
第二加密用户身份数据;
32.对所述第一方第二加密用户身份数据和第二方第二加密用户身份数据取交集,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。
33.可选地,所述基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型的步骤包括:
34.根据所述第一方目标用户业务数据,得到第一方加密目标用户业务数据;
35.根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据;
36.基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。
37.可选地,所述根据所述第一方目标用户业务数据,得到第一方加密目标用户业务数据的步骤包括:
38.将第一加密条件和所述第一方目标用户业务数据输入第一方区域常驻用户识别模型;
39.通过所述第一方区域常驻用户识别模型,将所述第一加密条件发送到所述第二方区域常驻用户识别模型;
40.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二加密条件;
41.通过所述第一方区域常驻用户识别模型,对所述第一方目标用户业务数据进行初始化;
42.基于第一预设条件,根据所述初始化的第一方目标用户业务数据,计算得到第一加权特征值;
43.根据所述第一加密条件,通过所述第一方区域常驻用户识别模型,对所述第一加权特征值进行加密,生成所述第一方加密目标用户业务数据。
44.可选地,所述根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据的步骤包括:
45.通过所述第一方区域常驻用户识别模型,将所述第一方加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;
46.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二方加密目标用户业务数据;
47.根据所述第二加密条件,通过所述第一方区域常驻用户识别模型,对所述第一方加密目标用户业务数据和第二方加密目标用户业务数据进行加密,生成双方第一加密目标用户业务数据;
48.根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据。
49.可选地,所述根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据的步骤包括:
50.通过所述第一方区域常驻用户识别模型,将所述双方第一加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;
51.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的双方第二加密目标用户业务数据;
52.根据所述第一加密条件和第二加密条件,通过所述第一方区域常驻用户识别模型,对所述双方第二加密目标用户业务数据进行解密,获取双方第二目标用户业务数据;
53.通过所述第一方区域常驻用户识别模型,将所述双方第二目标用户业务数据发送到所述第二方区域常驻用户识别模型;
54.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的所述双方第一目标用户业务数据。
55.可选地,所述基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型的步骤包括:
56.基于所述逻辑回归算法,根据所述双方第一目标用户业务数据,计算得到第一梯度值;
57.根据所述第一梯度值,通过梯度下降法更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。
58.可选地,所述基于所述隐私集合求交技术,构建目标用户业务数据训练集的步骤之前,还包括:
59.采集所述第一方目标用户业务数据和第二方目标用户业务数据。
60.可选地,所述采集所述第一方目标用户业务数据和第二方目标用户业务数据的步骤包括:
61.采集所述第一方目标用户业务数据;
62.获取目标用户移动设备连接的常驻基站的位置坐标;
63.根据所述常驻基站的位置坐标,确认常驻基站所处区域为目标区域;
64.根据预设的休息时间阈值,通过目标用户移动设备所处位置,生成目标用户在凌晨时段的常驻位置信息;
65.根据预设的工作时间阈值,通过目标用户移动设备所处位置,生成目标用户在工作时段的常驻位置信息;
66.根据所述目标用户在凌晨时段的常驻位置信息和目标用户在工作时段的常驻位置信息,得到第二方目标用户业务数据。
67.可选地,所述根据预设的工作时间阈值,通过目标用户移动设备所处位置,生成目标用户在工作时段的常驻位置信息的步骤之后,还包括:
68.接收用户贷款请求;
69.根据所述用户贷款请求,获取目标用户申请贷款时移动设备的位置信息;
70.根据所述目标用户申请贷款时移动设备的位置信息,获取预设范围内的基站位置坐标;
71.根据所述预设范围内的基站位置坐标,确认预设范围内的基站所处区域为目标区域。
72.可选地,所述将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果的步骤包括:
73.将所述待识别用户业务数据中的第一方待识别用户业务数据加密传输至所述第一方区域常驻用户识别模型进行识别,获取第一方用户识别结果;
74.将所述待识别用户业务数据中的第二方待识别用户业务数据加密传输至所述第二方区域常驻用户识别模型进行识别,获取第二方用户识别结果;
75.根据所述第一方用户识别结果和第二方用户识别结果,生成所述区域常驻用户识别结果。
76.此外,为实现上述目的,本发明还提供一种区域常驻用户识别装置,所述区域常驻用户识别装置包括:
77.接收模块,用于接收待识别用户业务数据;
78.识别分析模块,用于将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。
79.本发明实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的区域常驻用户识别程序,所述区域常驻用户识别程序被所述处理器执行时实现如上所述的区域常驻用户识别方法的步骤。
80.本发明实施例还提出一种计算器可读存储介质,所述计算机可读存储介质上存储有区域常驻用户识别程序,所述区域常驻用户识别程序被处理器执行时实现如上所述的区域常驻用户识别方法的步骤。
81.本发明实施例提出的一种区域常驻用户识别方法、装置、设备及存储介质,通过接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。通过区域常驻用户识别模型,对区域常驻用户进行精确识别。由此,实现了对区域常驻用户的识别,解决了对区域常驻用户的识别精准度低的技术问题。相较于现有技术,具有精准度高、数据实时性强、数据安全性高的优势。
82.以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
附图说明
83.图1为本发明区域常驻用户识别装置所属终端设备的功能模块示意图;
84.图2为本发明区域常驻用户识别方法第一示例性实施例的流程示意图;
85.图3为本发明区域常驻用户识别方法第二示例性实施例的流程示意图;
86.图4为本发明区域常驻用户识别方法第三示例性实施例的流程示意图;
87.图5为本发明区域常驻用户识别方法第四示例性实施例的流程示意图;
88.图6为本发明区域常驻用户识别方法第五示例性实施例的流程示意图;
89.图7为本发明区域常驻用户识别方法第六示例性实施例的流程示意图;
90.图8为本发明区域常驻用户识别方法第七示例性实施例的流程示意图;
91.图9为本发明区域常驻用户识别方法第八示例性实施例的流程示意图;
92.图10为本发明区域常驻用户识别方法第九示例性实施例的流程示意图;
93.图11为本发明区域常驻用户识别方法第十示例性实施例的流程示意图;
94.图12为本发明区域常驻用户识别方法第十一示例性实施例的流程示意图;
95.图13为本发明区域常驻用户识别方法第十二示例性实施例的流程示意图;
96.图14为本发明区域常驻用户识别方法第十三示例性实施例的流程示意图;
97.图15为本发明区域常驻用户识别方法第十四示例性实施例的流程示意图;
98.图16为本发明区域常驻用户识别方法第十五示例性实施例的流程示意图。
99.本发明目的实现、功能特点及优点将结合实施例,参照附图做进一步说明。
具体实施方式
100.应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
101.本发明实施例的主要解决方案是:接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。通过建立区域常驻用户识别模型,对区域常驻用户进行精确识别。由此,实现了对区域常驻用户的识别,解决了对区域常驻用户的识别精准度低的技术问题。相较于现有技术,具有精准度高、数据时效性强、数据安全性强的优势。
102.本发明实施例涉及的技术术语:
103.联邦学习(federated learning):是一种分布式机器学习方法,旨在解决数据隐私和数据中心集中化的问题。它允许在多个本地设备(例如智能手机、传感器等)上进行机器学习模型的训练,而无需将数据传输到中央服务器。
104.在传统的机器学习方法中,通常需要将所有数据集中到一个中央服务器上进行模型训练。然而,这样的集中式方法可能存在数据隐私泄露的风险,因为用户的数据需要上传到中央服务器进行处理。此外,数据集中化也可能导致数据传输延迟和带宽限制的问题。
105.联邦学习通过在本地设备上进行分散的模型训练,解决了这些问题。其基本思想是将模型的训练过程下放到本地设备上,每个设备使用自己的数据进行模型更新,并将更新后的模型参数上传到中央服务器。然后,中央服务器根据接收到的参数进行模型聚合,生成最新的全局模型,并返回给各个本地设备。
106.联邦学习的核心优势在于保护用户数据隐私。因为数据不需要离开本地设备,用户可以保持对其数据的完全控制,而无需将其共享给第三方。同时,联邦学习还可以减少数据传输量,节省网络带宽,并显著降低了训练过程中的延迟。
107.总而言之,联邦学习是一种兼顾数据隐私和模型效果的机器学习方法,适用于需要在分布式环境下进行模型训练的场景。它通过将计算下放到本地设备上,并利用模型聚合技术,实现了数据隐私保护、高效训练和个性化模型更新的目标。
108.纵向联邦学习(vertical federated learning):是联邦学习的一种变体,用于处理数据集具有相同特征但彼此分割的情况。在纵向联邦学习中,参与方之间分享的是相同的特征,但每个参与方只拥有部分的样本数据。这种情况经常出现在需要合并来自不同组织或数据源的数据进行建模或训练的场景。
109.纵向联邦学习通过隐私保护的协议和算法,在不泄露具体数据的前提下,实现了模型训练和参数更新的合作。其基本思想是通过加密和安全计算技术,在保持数据隐私的
同时,将不同数据源的特征进行匹配和对齐,以实现模型的训练和参数更新。
110.纵向联邦学习的优点在于充分利用了不同数据源的信息,并保护了数据隐私。相比于传统的集中式数据融合方法,纵向联邦学习实现了在分散数据的情况下进行模型训练和合作,避免了数据共享和泄露的风险。
111.然而,纵向联邦学习也面临一些挑战。由于数据源之间的差异和特征匹配的复杂性,纵向联邦学习可能需要更复杂的协议和计算方法来实现特征对齐和模型训练。此外,由于加密和安全计算等操作的开销,纵向联邦学习往往需要更多的计算资源和时间。
112.总的来说,纵向联邦学习是一种能够在保护数据隐私的前提下,合并具有相同特征但彼此分割的数据进行模型训练和参数更新的方法。它为跨组织或跨数据源的合作提供了一种隐私安全且高效的解决方案。
113.diffie-hellman密钥交换协议:是一种用于在不安全通信渠道上进行密钥交换的加密协议,通过离散对数问题的困难性保证了密钥的安全性。它是公钥密码学的重要组成部分,被广泛应用于各种安全通信场景中。它由whitfield diffie和martin hellman于1976年提出,是公钥密码学的重要基石之一。
114.隐私集合求交技术(privacy-preserving set intersection):是一种用于在保护隐私的前提下,对两个或多个参与方的数据集进行交集计算的方法。它允许参与方共同确定数据集之间的交集,而无需公开或共享实际的数据内容。
115.常用的隐私集合求交技术包括基于哈希的方法(如bloom filter),差分隐私技术(如局部敏感哈希),安全多方计算协议(如安全多方求和协议)等。这些方法在保护数据隐私的同时,能够实现高效的集合求交操作。
116.数据对齐(data alignment):是指将多个数据集或数据源中的数据按照某种规则或特定的方式进行匹配和整理,使得它们具有相同的结构或对应关系,从而实现数据之间的协调和一致性。
117.在数据分析和处理过程中,数据通常来自不同的来源,结构和格式可能各不相同。数据对齐的目的是消除数据之间的差异,使其能够进行有效的比较、合并或计算,以实现更深入的分析和洞察。
118.数据对齐的具体方法和步骤会根据数据的特点和需求而有所不同。常用的数据对齐工具和技术包括数据库连接语句(如sql join操作)、数据清洗和预处理工具、数据集成和etl工具,以及编程语言中的数据处理库(如python中的pandas)等。
119.数据对齐的好处包括提高数据质量和一致性,减少数据冗余和错误,便于后续的分析和建模工作。它在各种领域的数据处理和分析中都具有重要作用,包括商业智能、金融风控、客户关系管理等。
120.原根:是一个数论中的概念。给定一个正整数m,如果存在一个整数g,使得对于任意正整数x,g^x mod m不等于1,并且当x取1到之间的任意正整数时,g^x mod m都互不相同,则称g为模m的原根。
121.其中表示小于m且与m互质的正整数的个数,也称为欧拉函数或者phi函数。
122.原根在数论中具有重要的性质和应用,例如它可以用于解决离散对数问题、构造循环群、密码学中的公钥加密算法等。在一些计算问题中,原根的存在性和性质是关键的。
123.哈希(hash):也被称为散列,是一种将任意长度的数据映射为固定长度值的过程。
哈希函数(hash function)是实现哈希算法的数学函数,它以输入数据为基础,生成唯一的哈希值。
124.常见的哈希函数包括md5、sha-1、sha-256等,不同的哈希函数在哈希算法的设计原理和安全性上可能有所差异。在密码存储和数字签名等需要更高安全性的场景中,建议使用更强大的哈希函数,如sha-256。
125.逻辑回归(logistic regression):是一种用于解决二分类问题的机器学习算法。尽管它名为“回归”,但实际上是一种分类算法。
126.逻辑回归的主要思想是通过建立一个逻辑回归模型,将输入特征与概率进行映射,然后将概率转化为类别标签进行分类。逻辑回归使用的是逻辑函数(也称为sigmoid函数),将线性组合的特征转换为0到1之间的概率值。
127.对数损失函数(log loss):也被称为交叉熵损失函数(cross-entropy loss),是常用于衡量分类问题中模型预测结果与真实标签之间差异的一种损失函数。
128.对数损失函数通过计算预测概率和真实标签的对数值来衡量模型的不确定性和错误程度。当预测结果与真实标签完全一致时,对数损失函数为0,否则损失函数的值越大表示模型预测的偏离程度越大。
129.在实际应用中,对数损失函数广泛应用于二元分类、多元分类、文本分类等任务中,用于度量模型的性能和指导模型训练。通过优化对数损失函数,可以得到更准确的分类模型。
130.梯度下降法(gradient descent):是一种常用的优化算法,用于求解函数的最小值或最大值。它的基本思想是通过不断迭代调整参数的方式,沿着函数梯度的方向寻找最优解。
131.梯度下降法是机器学习中常用的优化算法,被广泛应用于线性回归、逻辑回归、神经网络等模型的参数优化过程中。它是训练模型的核心算法之一,帮助模型逐步优化并逼近最佳参数配置。
132.批处理数据集(batch dataset):是在机器学习和深度学习中常用的数据处理方式之一。它将数据样本划分为多个批次(batches),每个批次包含多个数据样本,以便进行高效的模型训练。
133.批处理数据集的大小选择应该权衡一些因素,如内存容量、计算资源、训练速度和模型收敛性等。过小的批次可能导致训练不稳定,而过大的批次可能导致计算效率低下。根据具体任务和实际情况,需要进行适当的调优和实验来选择合适的批次大小。
134.批大小(batch size):是在机器学习和深度学习中用来指定每个批次包含的数据样本数量的参数。它对模型训练的效果、速度和内存利用等方面都有影响。
135.一般来说,批大小的选择常常是一种折中。常见的批大小取值范围通常在几十到几千之间,具体取决于任务以及可用的计算资源。在实际应用中,可以通过实验和调优来选择最佳的批大小,以获得良好的训练效果。
136.损失函数梯度:在机器学习和优化算法中,损失函数梯度指的是损失函数对模型参数的偏导数。梯度是一个向量,其中每个元素表示损失函数对相应参数的偏导数。
137.对于许多机器学习算法来说,包括逻辑回归、线性回归和神经网络等,梯度下降是一种常用的优化方法。该方法通过更新模型参数的方向和步长,使得损失函数逐渐减小,从
而找到最优的参数值。
138.通过计算损失函数对模型参数的梯度,可以确定参数更新的方向和步长。常见的优化算法如梯度下降、随机梯度下降和批量梯度下降等都利用了梯度信息来更新模型参数,以最小化损失函数并找到最优的参数值。
139.在某些复杂的模型或非凸优化问题中,梯度可能不容易计算或存在其他优化方法。但在大多数情况下,损失函数的梯度提供了一种有效的方式来优化模型参数。
140.同态加密(homomorphic encryption):是一种特殊的加密技术,允许在加密的状态下对加密数据进行计算,而无需解密。这意味着即使在加密数据的情况下,也可以对其进行运算并得到相应的结果,而无需解密得到明文数据。
141.同态加密密文计算算法:是同态加密技术的核心部分,它允许在加密的状态下执行计算操作并得到相应的结果。以下是两种常见的同态加密密文计算算法:
142.1、加法密文计算:
143.加法同态性允许在加密的状态下执行加法操作。对于两个加密的数值,其加法的结果的加密形式与这两个加密数值分别进行加法后的加密结果是相同的。
144.2、乘法密文计算:
145.乘法同态性允许在加密的状态下执行乘法操作。对于两个加密的数值,其乘法的结果的加密形式与这两个加密数值分别进行乘法后的加密结果是相同的。
146.实际使用的同态加密算法可能具有不同的实现细节和特性。目前,有多种同态加密方案可供选择,如paillier同态加密、rsa同态加密和bgv同态加密等。每种方案都有其自己的优缺点和适用场景。
147.同态加密算法在计算过程中通常涉及大量的数学运算和密码学原理,所以在实际应用中需要对性能和安全性进行综合考虑。此外,算法的具体实现还需要根据具体的同态加密方案和应用需求进行调整和优化。
148.含噪加密的梯度(encrypted gradient with noise):是一种用于在保护隐私的情况下进行梯度计算的技术。它结合了同态加密和差分隐私的思想,以确保在计算梯度时不会泄露敏感的原始数据。
149.梯度是指损失函数对于模型参数的变化率,用于指导模型参数的更新。在机器学习中,通常使用梯度下降算法来最小化损失函数,从而优化模型。然而,如果直接计算梯度,可能会泄露训练数据的详细信息,而这些数据可能包含个人隐私或商业机密。
150.含噪加密的梯度技术能够在保护数据隐私的同时进行模型训练。通过添加噪声来掩盖原始数据的细节,可以确保不会泄露敏感信息。然而,噪声的引入会对梯度估计的准确性和模型的训练效果产生一定的影响,因此需要在隐私保护与模型性能之间进行权衡。
151.含噪梯度(noisy gradient):是一种在隐私保护场景下使用的机器学习技术。它通过在计算梯度时引入随机噪声,以保护原始数据的隐私。
152.在传统的机器学习中,梯度是指损失函数对于模型参数的偏导数,用于指导模型参数的更新。然而,直接计算梯度可能会泄露训练数据的详细信息,特别是当训练数据包含敏感信息时。
153.含噪梯度的目标是在保护数据隐私的前提下,尽可能准确地估计真实的梯度。
154.含噪梯度技术通过在梯度计算中引入随机噪声,保护了原始数据的隐私。它在隐
私保护和模型性能之间存在一定的权衡。较大的噪声可能会提供更好的隐私保护,但也会降低梯度估计的准确性,从而影响模型的训练效果。因此,需要根据具体应用场景中的隐私需求和模型性能要求来选择适当的噪声水平。
155.本发明实施例考虑到,使用相关技术方案对区域常驻用户进行识别时,使用征信数据或权威机构证明数据缺乏时效性,数据更新慢,无法保证当前用户在目标区域的常驻时间;仅使用用户轨迹数据有身份冒用问题,无法保证身份数据与人员的真实对应;使用单领域数据用户常驻地点类别识别精度较低;传统的使用多方数据的建模过程数据存在泄漏及滥用风险。
156.基于此,本发明实施例提出一种解决方案,可以在用户申请乡村振兴或惠农信贷产品过程中,帮助资金方更加安全精准地识别用户是否为农村常驻用户。本方案使用联邦学习技术,安全地聚合资金方提供的征信地点登记数据、用户申请时刻地点数据、权威机构证明数据以及通信运营商提供的用户常驻基站数据进行建模,同时根据监管要求不断迭代数据及模型,保证模型的精准性和时效性。
157.具体地,参照图1,图1为本发明区域常驻用户识别装置所属终端设备的功能板块示意图。该区域常驻用户识别装置可以独立于终端设备的、能够进行区域常驻用户识别的装置,其可以通过硬件或者软件的形式承载于终端设备上。该终端设备可以为手机、平板电脑等具有数据处理功能的智能移动设备,还可以为具有数据处理功能的固定终端设备或服务器等。
158.在本实施例中,该区域常驻用户识别装置所属终端设备至少包括输出模块110、处理器120、存储器130以及通信模块140。
159.存储器130中存储有操作系统以及区域常驻用户识别程序,区域常驻用户识别装置可以通过接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。通过该区域常驻用户识别程序对区域常驻用户进行识别,计算加权特征值等信息存储于该存储器130中;输出模块110可为显示屏等。通信模块140可以包括wifi模块、移动通信模块以及蓝牙模块等,通过通信模块140与外部设备或服务器进行通信。
160.其中存储器130中的区域常驻用户识别程序被处理器执行时实现以下步骤:
161.接收待识别用户业务数据;
162.将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。
163.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
164.基于隐私集合求交技术、所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型。
165.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
166.基于所述隐私集合求交技术,构建目标用户业务数据训练集,所述目标用户业务
数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据;
167.基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型;
168.基于所述纵向联邦学习技术及逻辑回归算法,通过所述第二方目标用户业务数据更新第二方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第二方区域常驻用户识别模型。
169.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
170.获取用户身份数据,所述用户身份数据包括:第一方用户身份数据和第二方用户身份数据;
171.通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息;
172.根据所述目标用户身份信息,获取所述第一方目标用户业务数据和第二方目标用户业务数据,建立所述目标用户业务数据训练集。
173.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
174.基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服务器,获取第一方目标用户身份信息;
175.基于所述隐私集合求交技术,根据所述第二方用户身份数据,通过所述数据对齐服务器中的第二方数据对齐服务器,获取第二方目标用户身份信息;
176.根据所述第一方目标用户身份信息和第二方目标用户身份信息,得到所述目标用户身份信息。
177.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
178.将数据对齐加密条件和所述第一方用户身份数据输入所述第一方数据对齐服务器;
179.根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第一方用户身份数据进行加密,生成第一方第一加密用户身份数据;
180.通过所述第一方数据对齐服务器,将所述第一方第一加密用户身份数据发送到所述第二方数据对齐服务器;
181.通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第二方第一加密用户身份数据;
182.根据所述第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。
183.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
184.根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第二方第一加密用户身份数据进行加密,生成第二方第二加密用户身份数据;
185.通过所述第一方数据对齐服务器,将所述第二方第二加密用户身份数据发送到所述第二方数据对齐服务器;
186.通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第一方第二加密用户身份数据;
187.对所述第一方第二加密用户身份数据和第二方第二加密用户身份数据取交集,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。
188.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
189.根据所述第一方目标用户业务数据,得到第一方加密目标用户业务数据;
190.根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据;
191.基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。
192.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
193.将第一加密条件和所述第一方目标用户业务数据输入所述第一方区域常驻用户识别模型;
194.通过所述第一方区域常驻用户识别模型,将所述第一加密条件发送到所述第二方区域常驻用户识别模型;
195.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二加密条件;
196.通过所述第一方区域常驻用户识别模型,对所述第一方目标用户业务数据进行初始化;
197.基于第一预设条件,根据所述初始化的第一方目标用户业务数据,计算得到第一方加权特征值;
198.根据所述第一加密条件,通过所述第一方区域常驻用户识别模型,对所述第一加权特征值进行加密,生成所述第一方加密目标用户业务数据。
199.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
200.通过所述第一方区域常驻用户识别模型,将所述第一方加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;
201.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二方加密目标用户业务数据;
202.根据所述第二加密条件,通过所述第一方区域常驻用户识别模型,对所述第一方加密目标用户业务数据和第二方加密目标用户业务数据进行加密,生成双方第一加密目标用户业务数据;
203.根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据。
204.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
205.通过所述第一方区域常驻用户识别模型,将所述双方第一加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;
206.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的双方第二加密目标用户业务数据;
207.根据所述第一加密条件和第二加密条件,通过所述第一方区域常驻用户识别模型,对所述双方第二加密目标用户业务数据进行解密,获取双方第二目标用户业务数据;
208.通过所述第一方区域常驻用户识别模型,将所述双方第二目标用户业务数据发送到所述第二方区域常驻用户识别模型;
209.通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的所述双方第一目标用户业务数据。
210.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
211.基于所述逻辑回归算法,根据所述双方第一目标用户业务数据,计算得到第一方梯度值;
212.根据所述第一方梯度值,通过梯度下降法更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。
213.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
214.采集所述第一方目标用户业务数据。
215.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
216.获取目标用户移动设备连接的常驻基站的位置坐标;
217.根据所述常驻基站的位置坐标,确认常驻基站所处区域为目标区域;
218.根据预设的休息时间阈值,通过目标用户移动设备所处位置,生成目标用户在凌晨时段的常驻位置信息;
219.根据预设的工作时间阈值,通过目标用户移动设备所处位置,生成目标用户在工作时段的常驻位置信息;
220.根据所述目标用户在凌晨时段的常驻位置信息和目标用户在工作时段的常驻位置信息,得到所述第一方目标用户业务数据。
221.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
222.接收用户贷款请求;
223.根据所述用户贷款请求,获取目标用户申请贷款时移动设备的位置信息;
224.根据所述目标用户申请贷款时移动设备的位置信息,获取预设范围内的基站位置坐标;
225.根据所述预设范围内的基站位置坐标,确认预设范围内的基站所处区域为目标区域。
226.进一步地,存储器130中的区域常驻用户识别程序被处理器执行时还实现以下步骤:
227.将所述待识别用户业务数据中的第一方待识别用户业务数据加密传输至所述第一方区域常驻用户识别模型进行识别,获取第一方用户识别结果;
228.将所述待识别用户业务数据中的第二方待识别用户业务数据加密传输至所述第二方区域常驻用户识别模型进行识别,获取第二方用户识别结果;
229.根据所述第一方用户识别结果和第二方用户识别结果,生成所述区域常驻用户识别结果。
230.本实施例通过上述方案,具体通过接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。通过建立区域常驻用户识别模型,对区域常驻用户进行精确识别。由此,实现了对区域常驻用户的识别,解决了对区域常驻用户的识别精准度低的技术问题。相较于现有技术,具有精准度高、数据时效性强、数据安全性强的优势。
231.基于上述终端设备架构但不限于上述架构,提出本发明方法实施例。
232.参照图2,图2为本发明区域常驻用户识别方法第一示例性实施例的流程示意图。所述区域常驻用户识别方法包括:
233.步骤s101,接收待识别用户业务数据;
234.本实施例方法的执行主体可以是一种区域常驻用户识别服务系统,还可以是一种区域常驻用户识别装置,也可以是一种区域常驻用户识别设备,本实施例以区域常驻用户识别装置进行举例,该区域常驻用户识别装置可以集成在具有数据处理功能的设备上。
235.为了解决当前区域常驻用户识别准确率低的问题,结合多方数据实现对区域常驻用户的精准识别显得尤为重要,为了实现对区域常驻用户的精准识别,采取以下步骤实现:
236.首先,设置特殊的区域常驻用户识别装置集成在具有数据处理功能的设备上,通过区域常驻用户识别装置能对待识别的用户业务数据进行识别;
237.最后,通过区域常驻用户识别装置,接收待识别用户业务数据。
238.步骤s102,将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。
239.当接收到待识别用户业务数据后,通过区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,采取以下步骤实现:
240.首先,区域常驻用户识别装置将待识别用户业务数据输入预先训练好的区域常驻用户识别模型;
241.最后,通过区域常驻用户识别模型对待识别用户业务数据进行处理,得到区域常驻用户识别结果。
242.本实施例通过上述方案,通过接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。通过建立区域常驻用户识别模型,对区域常驻用户进行精确识别。由此,实现了对区域常驻用户的识别,解决了对区域常驻用户的识别精准度低的技术问题。相较于现有技术,具有精准度高、数据时效性强、数据安全性强的优势。
243.参照图3,图3为本发明区域常驻用户识别方法第二示例性实施例的流程示意图。
244.基于上述图2所示的实施例,所述步骤s101,接收待识别用户业务数据之前还包括:
245.步骤s001,基于隐私集合求交技术、所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型。
246.具体地,接收待识别用户业务数据之前,先对区域常驻用户识别模型进行模型训练,采取以下步骤实现:
247.首先,区域常驻用户识别装置通过数据对齐服务器,得到目标用户业务数据训练集;
248.最后,区域常驻用户识别装置根据目标用户业务数据训练集,更新区域常驻用户识别模型参数,对区域常驻用户识别模型进行模型训练。
249.本实施例通过上述方案,具体通过,基于隐私集合求交技术、所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型。基于隐私集合求交技术、纵向联邦学习技术及逻辑回归算法,完成了对对区域常驻用户识别模型的训练。由此,实现了对区域常驻用户识别模型的训练,提高了模型的准确率,为区域常驻用户的识别提供了支持。
250.参照图4,图4为本发明区域常驻用户识别方法第三示例性实施例的流程示意图。
251.基于上述图3所示的实施例,所述步骤s001,基于隐私集合求交技术、所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型包括:
252.步骤s0011,基于所述隐私集合求交技术,构建目标用户业务数据训练集,所述目标用户业务数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据;
253.步骤s0012,基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型;
254.步骤s0013,基于所述纵向联邦学习技术及逻辑回归算法,通过所述第二方目标用户业务数据更新第二方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第二方区域常驻用户识别模型。
255.具体地,先构建目标用户业务数据训练集,再根据目标用户业务数据训练集,分别对双方的区域常驻用户识别模型进行训练,采取以下步骤实现:
256.首先,区域常驻用户识别装置调用数据对齐服务器,基于隐私集合求交技术,构建目标用户业务数据训练集,其中,目标用户业务数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据;
257.然后,区域常驻用户识别装置将第一方目标用户业务数据输入第一方区域常驻用户识别模型,通过对第一方区域常驻用户识别模型参数进行更新,训练第一方区域常驻用户识别模型,其中,第一方可以是运营商,第一方目标用户业务数据可以是用户移动设备定位信息相关数据,如用户申请贷款定位是否为农村地区,用户自贷款申请日回退365天凌晨时段(每天晚间0点至凌晨5点)常驻地点是否为农村地区,用户自贷款申请日回退365天工作时段(每天上午8点半至下午5点半)常驻地点是否为农村地区;
258.最后,区域常驻用户识别装置将第二方目标用户业务数据输入第二方区域常驻用
户识别模型,通过对第二方区域常驻用户识别模型参数进行更新,训练第二方区域常驻用户识别模型,其中,第二方可以是资金方,第二方目标用户业务数据可以是用户征信领域的地点信息,如用户生活常驻地是否为农村,用户工作常驻地是否为农村,用户户口所在地是否为农村,用户配偶常驻地是否为农村,用户配偶工作常驻地是否为农村,用户配偶户口所在地是否为农村,用户子女生活常驻地是否为农村,用户子女工作常驻地是否为农村,用户子女户口所在地是否为农村,用户是否有农村地区权威机构(乡镇政府、村委会居住证明),用户是否为农村地区社保。
259.本实施例通过上述方案,具体通过基于所述隐私集合求交技术,构建目标用户业务数据训练集,所述目标用户业务数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据;基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型;基于所述纵向联邦学习技术及逻辑回归算法,通过所述第二方目标用户业务数据更新第二方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第二方区域常驻用户识别模型。通过构建目标用户业务数据训练集,完成了对区域常驻用户识别模型的训练。由此,实现了对区域常驻用户识别模型的训练,提高了模型的准确率,为区域常驻用户的识别提供了支持。
260.参照图5,图5为本发明区域常驻用户识别方法第四示例性实施例的流程示意图。
261.基于上述图4所示的实施例,所述步骤s0011,基于所述隐私集合求交技术,构建目标用户业务数据训练集,所述目标用户业务数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据包括:
262.步骤s00111,获取用户身份数据,所述用户身份数据包括:第一方用户身份数据和第二方用户身份数据;
263.步骤s00112,通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息;
264.步骤s00113,根据所述目标用户身份信息,获取所述第一方目标用户业务数据和第二方目标用户业务数据,建立所述目标用户业务数据训练集。
265.具体地,通过数据对齐服务器,基于隐私集合求交技术,根据用户身份数据构建目标用户业务数据训练集,采取以下步骤实现:
266.首先,区域常驻用户识别装置获取用户身份数据,其中,用户身份数据包括第一方用户身份数据和第二方用户身份数据,双方的用户身份数据可以是用户身份证号或相同加密方法的身份证号;
267.其次,区域常驻用户识别装置调用数据对齐服务器,基于隐私集合求交技术,对第一方用户身份数据和第二方用户身份数据进行数据对齐,得到目标用户身份信息;
268.最后,区域常驻用户识别装置根据目标用户身份信息,得到第一方目标用户业务数据和第二方目标用户业务数据,建立目标用户业务数据训练集。
269.本实施例通过上述方案,具体通过获取用户身份数据,所述用户身份数据包括:第一方用户身份数据和第二方用户身份数据;通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息;根据所述目标用户身份信息,获取所述第一方目标用户业务数据和第二方目标用户业务数据,建立所述目标用
户业务数据训练集。根据用户身份数据,构建了目标用户业务数据训练集。由此,建立了目标用户业务数据训练集,为对区域常驻用户识别模型的训练提供了支持。
270.参照图6,图6为本发明区域常驻用户识别方法第五示例性实施例的流程示意图。
271.基于上述图5所示的实施例,所述步骤s00112,通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息包括:
272.步骤s001121,基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服务器,获取第一方目标用户身份信息;
273.步骤s001122,基于所述隐私集合求交技术,根据所述第二方用户身份数据,通过所述数据对齐服务器中的第二方数据对齐服务器,获取第二方目标用户身份信息;
274.步骤s001123,根据所述第一方目标用户身份信息和第二方目标用户身份信息,得到所述目标用户身份信息。
275.具体地,通过数据对齐服务器,基于隐私集合求交技术,根据用户身份数据获取目标用户身份信息,采取以下步骤实现:
276.首先,区域常驻用户识别装置将第一方用户身份数据输入第一方数据对齐服务器,基于隐私集合求交技术,获取第一方目标用户身份信息;
277.然后,区域常驻用户识别装置将第二方用户身份数据输入第二方数据对齐服务器,基于隐私集合求交技术,获取第二方目标用户身份信息;
278.最后,根据第一方目标用户身份信息和第二方目标用户身份信息,得到目标用户身份信息。
279.本实施例通过上述方案,具体通过基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服务器,获取第一方目标用户身份信息;基于所述隐私集合求交技术,根据所述第二方用户身份数据,通过所述数据对齐服务器中的第二方数据对齐服务器,获取第二方目标用户身份信息;根据所述第一方目标用户身份信息和第二方目标用户身份信息,得到所述目标用户身份信息。根据用户身份数据,通过数据对齐服务器,得到了目标用户身份信息。由此,获得了目标用户身份信息,为构建目标用户业务数据训练集提供了支持。
280.参照图7,图7为本发明区域常驻用户识别方法第六示例性实施例的流程示意图。
281.基于上述图6所示的实施例,所述步骤s001121,基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服务器,获取第一方目标用户身份信息包括:
282.步骤s0011211,将数据对齐加密条件和所述第一方用户身份数据输入所述第一方数据对齐服务器;
283.步骤s0011212,根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第一方用户身份数据进行加密,生成第一方第一加密用户身份数据;
284.步骤s0011213,通过所述第一方数据对齐服务器,将所述第一方第一加密用户身份数据发送到所述第二方数据对齐服务器;
285.步骤s0011214,通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第二方第一加密用户身份数据;
286.步骤s0011215,根据所述第一方第一加密用户身份数据和第二方第一加密用户身
份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。
287.具体地,得到第一方用户身份数据后,通过第一方数据对齐服务器,基于隐私集合求交技术,获取第一方目标用户身份信息,采取以下步骤实现:
288.首先,区域常驻用户识别装置将数据对齐加密条件和第一方用户身份数据输入第一方数据对齐服务器;
289.其次,区域常驻用户识别装置根据预设的数据对齐加密条件,通过第一方数据对齐服务器,对第一方用户身份数据进行加密,生成第一方第一加密用户身份数据;
290.然后,区域常驻用户识别装置通过第一方数据对齐服务器,将第一方第一加密用户身份数据发送到第二方数据对齐服务器;
291.然后,区域常驻用户识别装置通过第一方数据对齐服务器,接收来自第二方数据对齐服务器的第二方第一加密用户身份数据,其中,第二方第一加密用户身份数据是通过第二方数据对齐服务器,根据预设的数据对齐加密条件,对第二方用户身份数据加密获得的;
292.最后,区域常驻用户识别装置根据第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过第一方数据对齐服务器,得到第一方目标用户身份信息。
293.以第一方为运营商a,第二方为资金方b,用户身份数据为用户身份证号数据,数据对齐加密条件为设用户持有值为x,约定大素数q和整数a,a是q的一个原根,加密方法为e(x)=a
x
modc为例。
294.假设通信运营商a拥有客户的身份证号数据为x1,x1,...xn,资金方b拥有客户的身份证号数据为y1,y2,...yn。
295.a对数据哈希并加密得到ua=b(h(x1)),e(h(x2)),...b(h(xn)),并发送给b;
296.b对数据哈希并加密得到us=b(h(y1)),e(h(y2)),...b(h(yn)),并发送给a;
297.a和b根据ua和us,分别得出运营商和资金方的目标用户身份信息。
298.本实施例通过上述方案,具体通过将数据对齐加密条件和所述第一方用户身份数据输入所述第一方数据对齐服务器;根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第一方用户身份数据进行加密,生成第一方第一加密用户身份数据;通过所述第一方数据对齐服务器,将所述第一方第一加密用户身份数据发送到所述第二方数据对齐服务器;通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第二方第一加密用户身份数据;根据所述第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。根据第一方用户身份数据,通过第一方数据对齐服务器,获得了第一方目标用户身份信息。由此,得到了第一方目标用户身份信息,为获取目标用户身份信息提供了支持。
299.参照图8,图8为本发明区域常驻用户识别方法第七示例性实施例的流程示意图。
300.基于上述图7所示的实施例,所述步骤s0011215,根据所述第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息包括:
301.步骤s00112151,根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第二方第一加密用户身份数据进行加密,生成第二方第二加密用户身份数据;
302.步骤s00112152,通过所述第一方数据对齐服务器,将所述第二方第二加密用户身
份数据发送到所述第二方数据对齐服务器;
303.步骤s00112153,通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第一方第二加密用户身份数据;
304.步骤s00112154,对所述第一方第二加密用户身份数据和第二方第二加密用户身份数据取交集,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。
305.具体地,通过第一方数据对齐服务器,对第一方第一加密用户身份数据和第二方第一加密用户身份数据进行处理,获取第一方目标用户身份信息,采取以下步骤实现:
306.首先,区域常驻用户识别装置根据预设的数据对齐加密条件,通过第一方数据对齐服务器,对第二方第一加密用户身份数据进行加密,生成第二方第二加密用户身份数据;
307.其次,区域常驻用户识别装置通过第一方数据对齐服务器,将第二方第二加密用户身份数据发送到第二方数据对齐服务器;
308.然后,区域常驻用户识别装置通过第一方数据对齐服务器,接收来自第二方数据对齐服务器的第一方第二加密用户身份数据,其中,第一方第二加密用户身份数据是通过第二方数据对齐服务器,根据预设的数据对齐加密条件对第一方第一加密用户身份数据加密获得的;
309.最后,对第一方第二加密用户身份数据和第二方第二加密用户身份数据求交集,通过所述第一方数据对齐服务器,得到第一方第二加密用户身份数据和第二方第二加密用户身份数据共同持有的数据,也就是第一方目标用户身份信息,完成数据对齐。
310.以第一方为运营商a,第二方为资金方b,用户身份数据为用户身份证号数据,第一方第一加密用户身份数据为ua,第一方第一加密用户身份数据为us,数据对齐加密条件为设用户持有值为x,约定大素数q和整数a,a是q的一个原根,加密方法为b(x)=a
x
modq为例。
311.b对ua加密得到u
as-b(u
a1
),e(u
a2
),...b(u
an
),并发送给a;
312.a收到us加密得到u
ba
=b(u
b1)
,e(u
b2
),...e(u
s2
),并发送给b;
313.a和b分别求u
a1
和u
s1
的交集,得到a方和b方共同持有的数据,得到双方的目标用户身份信息,完成数据对齐。
314.本实施例通过上述方案,具体通过根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第二方第一加密用户身份数据进行加密,生成第二方第二加密用户身份数据;通过所述第一方数据对齐服务器,将所述第二方第二加密用户身份数据发送到所述第二方数据对齐服务器;通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第一方第二加密用户身份数据;对所述第一方第二加密用户身份数据和第二方第二加密用户身份数据取交集,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。根据第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过第一方数据对齐服务器,获得了第一方目标用户身份信息。由此,得到了第一方目标用户身份信息,为获取目标用户身份信息提供了支持。
315.参照图9,图9为本发明区域常驻用户识别方法第八示例性实施例的流程示意图。
316.基于上述图4所示的实施例,所述步骤s0012,基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型包括:
317.步骤s00121,根据所述第一方目标用户业务数据,得到第一方加密目标用户业务
数据;
318.步骤s00122,根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据;
319.步骤s00123,基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。
320.具体地,根据第一方目标用户业务数据,对第一方区域常驻用户识别模型参数进行更新,训练第一方区域常驻用户识别模型,采取以下步骤实现:
321.首先,区域常驻用户识别装置将第一方目标用户业务数据输入第一方区域常驻用户识别模型进行处理,得到第一方加密目标用户业务数据;
322.然后,区域常驻用户识别装置通过第一方区域常驻用户识别模型,根据第一方加密目标用户业务数据,得到双方第一目标用户业务数据;
323.最后,基于逻辑回归算法,根据双方第一目标用户业务数据更新第一方区域常驻用户识别模型参数,对第一方区域常驻用户识别模型进行训练。
324.本实施例通过上述方案,具体通过根据所述第一方目标用户业务数据,得到第一方加密目标用户业务数据;根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据;基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。根据第一方目标用户业务数据,实现了对第一方区域常驻用户识别模型的训练。由此,训练了第一方区域常驻用户识别模型,提高了模型的准确率,为区域常驻用户的识别提供了支持。
325.参照图10,图10为本发明区域常驻用户识别方法第九示例性实施例的流程示意图。
326.基于上述图9所示的实施例,所述步骤s00121,根据所述第一方目标用户业务数据,得到第一方加密目标用户业务数据包括:
327.步骤s001211,将第一加密条件和所述第一方目标用户业务数据输入所述第一方区域常驻用户识别模型;
328.步骤s001212,通过所述第一方区域常驻用户识别模型,将所述第一加密条件发送到所述第二方区域常驻用户识别模型;
329.步骤s001213,通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二加密条件;
330.步骤s001214,通过所述第一方区域常驻用户识别模型,对所述第一方目标用户业务数据进行初始化;
331.步骤s001215,基于第一预设条件,根据所述初始化的第一方目标用户业务数据,计算得到第一方加权特征值;
332.步骤s001216,根据所述第一加密条件,通过所述第一方区域常驻用户识别模型,对所述第一加权特征值进行加密,生成所述第一方加密目标用户业务数据。
333.具体地,通过第一方区域常驻用户识别模型,根据第一方目标用户业务数据,得到第一方加密目标用户业务数据,采取以下步骤实现:
334.首先,区域常驻用户识别装置将第一加密条件和第一方目标用户业务数据输入第一方区域常驻用户识别模型,其中,目标用户业务数据包括特征向量、特征向量对应的逻辑
回归参数、标签中的一种或几种;
335.其次,区域常驻用户识别装置通过第一方区域常驻用户识别模型,将第一加密条件发送到第二方区域常驻用户识别模型;
336.然后,区域常驻用户识别装置通过第一方区域常驻用户识别模型,接收来自第二方区域常驻用户识别模型的第二加密条件;
337.然后,区域常驻用户识别装置通过第一方区域常驻用户识别模型,对第一方目标用户业务数据中的第一方特征向量对应的逻辑回归参数进行初始化;
338.然后,区域常驻用户识别装置基于第一预设条件,对初始化的第一方目标用户业务数据进行运算,得到第一方加权特征值;
339.最后,根据第一加密条件,通过第一方区域常驻用户识别模型,对第一方加权特征值进行加密,生成第一方加密目标用户业务数据。
340.以第一方为运营商a,第二方为资金方b,通信运营商a数据没有标签y,资金方b数据有标签y,设a方数据训练集提取得到的特征变量构成的特征向量为xa,a方特征向量对应的逻辑回归参数为θa,b方数据训练集提取得到特征变量构成的特征向量为xb,b方特征向量对应的逻辑回归参数为θb,第一预设条件为第一加密条件为同态加密公钥ka,第二预设条件为第二加密条件为同态加密公钥kb为例。
341.a、b双方交换同态加密公钥ka和kb;
342.a方及b方分别初始化逻辑回归参数θa和θb;
343.a方计算加权特征值ua,使用ka对ua进行加密得到[ua];
[0344]
b方计算加权特征值ub,使用ks对ub进行加密得到[ub]。
[0345]
本实施例通过上述方案,具体通过将第一加密条件和所述第一方目标用户业务数据输入所述第一方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,将所述第一加密条件发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二加密条件;通过所述第一方区域常驻用户识别模型,对所述第一方目标用户业务数据进行初始化;基于第一预设条件,根据所述初始化的第一方目标用户业务数据,计算得到第一方加权特征值;根据所述第一加密条件,通过所述第一方区域常驻用户识别模型,对所述第一加权特征值进行加密,生成所述第一方加密目标用户业务数据。根据第一方目标用户业务数据,获得了第一方加密目标用户业务数据。由此,得到了第一方加密目标用户业务数据,为计算双方第一目标用户业务数据提供了支持。
[0346]
参照图11,图11为本发明区域常驻用户识别方法第十示例性实施例的流程示意图。
[0347]
基于上述图9所示的实施例,所述步骤s00122,根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据包括:
[0348]
步骤s001221,通过所述第一方区域常驻用户识别模型,将所述第一方加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;
[0349]
步骤s001222,通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻
用户识别模型发送的第二方加密目标用户业务;
[0350]
步骤s001223,根据所述第二加密条件,通过所述第一方区域常驻用户识别模型,对所述第一方加密目标用户业务数据和第二方加密目标用户业务数据进行加密,生成双方第一加密目标用户业务数据;
[0351]
步骤s001224,根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据。
[0352]
具体地,在得到第一方加密目标用户业务数据后,通过第一方区域常驻用户识别模型,生成双方第一目标用户业务数据,采取以下步骤实现:
[0353]
首先,区域常驻用户识别装置通过第一方区域常驻用户识别模型,将第一方加密目标用户业务数据发送到第二方区域常驻用户识别模型;
[0354]
其次,区域常驻用户识别装置通过第一方区域常驻用户识别模型,接收来自第二方区域常驻用户识别模型的第二方加密目标用户业务数据,其中,第二方加密目标用户业务数据是通过第二方区域常驻用户识别模型,根据第二加密条件,对第二方加权特征值加密获得的,第二方加权特征值是基于第二预设条件,对初始化的第二方目标用户业务数据计算获得的;
[0355]
然后,区域常驻用户识别装置根据第二加密条件,通过第一方区域常驻用户识别模型,对第一方加密目标用户业务数据和第二方加密目标用户业务数据进行加密,生成双方第一加密目标用户业务数据;
[0356]
最后,根据双方第一加密目标用户业务数据,通过第一方区域常驻用户识别模型,获取双方第一目标用户业务数据。
[0357]
以第一方为运营商a,第二方为资金方b,通信运营商a数据没有标签y,资金方b数据有标签y,设a方数据训练集提取得到的特征变量构成的特征向量为xa,a方特征向量对应的逻辑回归参数为θa,b方数据训练集提取得到特征变量构成的特征向量为xb,b方特征向量对应的逻辑回归参数为θb,第一预设条件为第一加密条件为同态加密公钥ka,第一方加密目标用户业务数据为[ua],第二预设条件为第二加密条件为同态加密公钥kb为例,第二方加密目标用户业务数据为[ub]为例。
[0358]
b方将[ub]发送给a方;
[0359]
a方接收[ub],使用kb对ua进行加密得到[ua],使用kb对随机噪声εa进行加密得到[εa],同态加密密文计算算法为计算得出含噪加密的梯度
[0360]
a方根据得出双方第一目标用户业务数据;
[0361]
a方将[ua]发送给b方;
[0362]
b方接收[ua],使用ka对ub进行加密得到[ub],使用ka对随机噪声εb进行加密得到[εb],同态加密密文计算算法为计算得出含噪加密的梯度
[0363]
b方根据得出双方第二目标用户业务数据。
[0364]
本实施例通过上述方案,具体通过所述第一方区域常驻用户识别模型,将所述第一方加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二方加密目标用户业务数据;根据所述第二加密条件,通过所述第一方区域常驻用户识别模型,对所述第一方加密目标用户业务数据和第二方加密目标用户业务数据进行加密,生成双方第一加密目标用户业务数据;根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据。根据第一方加密目标用户业务数据,获得了双方第一目标用户业务数据。由此,得到了双方第一目标用户业务数据,为训练第一方区域常驻用户识别模型提供了支持。
[0365]
参照图12,图12为本发明区域常驻用户识别方法第十一示例性实施例的流程示意图。
[0366]
基于上述图11所示的实施例,所述步骤s001224,根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据包括:
[0367]
步骤s0012241,通过所述第一方区域常驻用户识别模型,将所述双方第一加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;
[0368]
步骤s0012242,通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的双方第二加密目标用户业务数据;
[0369]
步骤s0012243,根据所述第一加密条件和第二加密条件,通过所述第一方区域常驻用户识别模型,对所述双方第二加密目标用户业务数据进行解密,获取双方第二目标用户业务数据;
[0370]
步骤s0012244,通过所述第一方区域常驻用户识别模型,将所述双方第二目标用户业务数据发送到所述第二方区域常驻用户识别模型;
[0371]
步骤s0012245,通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的所述双方第一目标用户业务数据。
[0372]
具体地,得到双方第一加密目标用户业务数据后,通过第一方区域常驻用户识别模型,获取双方第一目标用户业务数据,采取以下步骤实现:
[0373]
首先,区域常驻用户识别装置通过第一方区域常驻用户识别模型,将双方第一加密目标用户业务数据发送到第二方区域常驻用户识别模型;
[0374]
其次,区域常驻用户识别装置通过第一方区域常驻用户识别模型,接收来自第二方区域常驻用户识别模型的双方第二加密目标用户业务数据,其中,双方第二加密目标用户业务数据是通过第二方区域常驻用户识别模型,根据第一加密条件对第一方加密目标用户业务数据和第二方加密目标用户业务数据加密获得的;
[0375]
然后,区域常驻用户识别装置根据第一加密条件和第二加密条件,通过第一方区域常驻用户识别模型,对双方第二加密目标用户业务数据进行解密,获取双方第二目标用户业务数据;
[0376]
然后,区域常驻用户识别装置通过第一方区域常驻用户识别模型,将双方第二目标用户业务数据发送到第二方区域常驻用户识别模型;
[0377]
最后,通过第一方区域常驻用户识别模型,接收第二方区域常驻用户识别模型发送的双方第一目标用户业务数据,其中,双方第一目标用户业务数据通过第二方区域常驻用户识别模型,根据第一加密条件和第二加密条件对双方第一加密目标用户业务数据解密获得。
[0378]
以第一方为运营商a,第二方为资金方b,通信运营商a数据没有标签y,资金方b数据有标签y,设a方数据训练集提取得到的特征变量构成的特征向量为xa,a方特征向量对应的逻辑回归参数为θa,b方数据训练集提取得到特征变量构成的特征向量为xb,b方特征向量对应的逻辑回归参数为θb,第一预设条件为第一加密条件为同态加密公钥ka,第二预设条件为第二加密条件为同态加密公钥kb,双方第二加密目标用户业务数据为双方第二加密目标用户业务数据为为例。
[0379]
a方将发送给b方;
[0380]
b方对加噪加密的梯度进行解密,得到双方第一目标用户业务数据,即含噪梯度将含噪梯度发送给a方;
[0381]
b方将发送给a方;
[0382]
a方对加噪加密的梯度进行解密,得到双方第二目标用户业务数据,即含噪梯度将含噪梯度发送给b方。
[0383]
本实施例通过上述方案,具体通过所述第一方区域常驻用户识别模型,将所述双方第一加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的双方第二加密目标用户业务数据;根据所述第一加密条件和第二加密条件,通过所述第一方区域常驻用户识别模型,对所述双方第二加密目标用户业务数据进行解密,获取双方第二目标用户业务数据;通过所述第一方区域常驻用户识别模型,将所述双方第二目标用户业务数据发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的所述双方第一目标用户业务数据。根据双方第一加密目标用户业务数据,获得了双方第一目标用户业务数据。由此,得到了双方第一目标用户业务数据,为训练第一方区域常驻用户识别模型提供了支持。
[0384]
参照图13,图13为本发明区域常驻用户识别方法第十二示例性实施例的流程示意图。
[0385]
基于上述图9所示的实施例,所述步骤s00123,基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型包括:
[0386]
步骤s001231,基于所述逻辑回归算法,根据所述双方第一目标用户业务数据,计算得到第一方梯度值;
[0387]
步骤s001232,根据所述第一方梯度值,通过梯度下降法更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。
[0388]
具体地,通过逻辑回归算法,对双方第一目标用户业务数据进行运算,更新第一方区域常驻用户识别模型参数,训练第一方区域常驻用户识别模型,采取以下步骤实现:
[0389]
首先,区域常驻用户识别装置基于所述逻辑回归算法,根据双方第一目标用户业务数据,计算得到第一方梯度值;
[0390]
最后,根据第一方梯度值,通过梯度下降法更新第一方区域常驻用户识别模型参数,训练第一方区域常驻用户识别模型。
[0391]
以第一方为运营商a,第二方为资金方b,通信运营商a数据没有标签y,资金方b数据有标签y,设a方数据训练集提取得到的特征变量构成的特征向量为xa,a方特征向量对应的逻辑回归参数为θa,b方数据训练集提取得到特征变量构成的特征向量为xb,b方特征向量对应的逻辑回归参数为θ0,双方第一目标用户业务数据为双方第二目标用户业务数据为为例。
[0392]
a方接收到含噪梯度减去噪声εa,可得到运营商梯度值;
[0393]
b方接收到含噪梯度减去噪声εb,可得到资金方梯度值。
[0394]
逻辑回归采用对数损失函数,对于训练集x∈s,损失函数可表示为:
[0395][0396]
逻辑回归使用梯度下降法更新参数:
[0397][0398]
其中,
[0399][0400]
其中,s'为批处理数据集,数据集大小即为batchsize大小。
[0401]
为实现各方数据本地计算,不泄露各方数据信息,因此采用同态加密的方式对计算的中间结果进行加密,为满足同态加密算法只支持整数、浮点数加法乘法的性质,因此将迭代共识更新参数公式中的损失函数导数部分进行泰勒展开,并给出同态加密形式:
[0402][0403]
本实施例通过上述方案,具体通过基于所述逻辑回归算法,根据所述双方第一目标用户业务数据,计算得到第一方梯度值;根据所述第一方梯度值,通过梯度下降法更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。根据双方第一目标用户业务数据,完成了对第一方区域常驻用户识别模型参数的更新。由此,训练了第一方区域常驻用户识别模型,提高了模型的准确率,为区域常驻用户的识别提供了支持。
[0404]
参照图14,图14为本发明区域常驻用户识别方法第十三示例性实施例的流程示意图。
[0405]
基于上述图4所示的实施例,所述步骤s0011,基于所述隐私集合求交技术,构建目标用户业务数据训练集,所述目标用户业务数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据之前还包括:
[0406]
步骤s0001,采集所述第一方目标用户业务数据。
[0407]
具体地,在构建目标用户业务数据训练集之前,采集所述第一方目标用户业务数据,采取以下步骤实现:
[0408]
首先,区域常驻用户识别装置获取目标用户移动设备的位置;
[0409]
最后,区域常驻用户识别装置根据目标用户移动设备的位置,采集第二方目标用户业务数据。
[0410]
本实施例通过上述方案,具体通过采集所述第一方目标用户业务数据。由此,获得了第一方目标用户业务数据和第二方目标用户业务数据。为构建目标用户业务数据训练集提供了支持。
[0411]
参照图15,图15为本发明区域常驻用户识别方法第十四示例性实施例的流程示意图。
[0412]
基于上述图14所示的实施例,所述步骤s0001,采集所述第一方目标用户业务数据包括:
[0413]
步骤s00011,获取目标用户移动设备连接的常驻基站的位置坐标;
[0414]
步骤s00012,根据所述常驻基站的位置坐标,确认常驻基站所处区域为目标区域;
[0415]
步骤s00013,根据预设的休息时间阈值,通过目标用户移动设备所处位置,生成目标用户在凌晨时段的常驻位置信息;
[0416]
步骤s00014,根据预设的工作时间阈值,通过目标用户移动设备所处位置,生成目标用户在工作时段的常驻位置信息;
[0417]
步骤s00015,接收用户贷款请求;
[0418]
步骤s00016,根据所述用户贷款请求,获取目标用户申请贷款时移动设备的位置信息;
[0419]
步骤s00017,根据所述目标用户申请贷款时移动设备的位置信息,获取预设范围内的基站位置坐标;
[0420]
步骤s00018,根据所述预设范围内的基站位置坐标,确认预设范围内的基站所处区域为目标区域;
[0421]
步骤s00019,根据所述目标用户在凌晨时段的常驻位置信息和目标用户在工作时段的常驻位置信息,得到所述第一方目标用户业务数据。
[0422]
具体地,在构建目标用户业务数据训练集之前,通过定位目标用户移动设备采集第一方目标用户业务数据,采取以下步骤实现:
[0423]
首先,区域常驻用户识别装置基于预设的时间段获取目标用户移动设备连接的常驻基站的位置坐标;
[0424]
其次,区域常驻用户识别装置根据常驻基站的位置坐标,确认常驻基站所处区域为目标区域,比如根据基站坐标反查基站所处地区在行政划分上是否为农村地区;
[0425]
然后,区域常驻用户识别装置根据预设的休息时间阈值,通过目标用户移动设备所处位置,生成目标用户在凌晨时段的常驻位置信息,比如设置凌晨时段常驻时间阈值为4,则如果该用户凌晨时段有大于等于4个小时常驻地点为农村,判定该用户在凌晨时段的常驻地点为农村;
[0426]
然后,区域常驻用户识别装置根据预设的工作时间阈值,通过目标用户移动设备
所处位置,生成目标用户在工作时段的常驻位置信息,比如设置工作时段常驻时间阈值为5,则如果该用户工作时段有大于等于5个小时常驻地点为农村,判定该用户在工作时段的常驻地点为农村;
[0427]
然后,区域常驻用户识别装置接收用户贷款请求;
[0428]
然后,区域常驻用户识别装置根据所述用户贷款请求,获取目标用户申请贷款时移动设备的位置信息;
[0429]
然后,区域常驻用户识别装置根据目标用户申请贷款时移动设备的位置信息,获取预设范围内的基站位置坐标;
[0430]
然后,区域常驻用户识别装置根据预设范围内的基站位置坐标,确认预设范围内的基站所处区域为目标区域;
[0431]
最后,区域常驻用户识别装置根据目标用户在凌晨时段的常驻位置信息和目标用户在工作时段的常驻位置信息,得到第一方目标用户业务数据。
[0432]
其中,区域常驻用户识别装置可以在用户申请贷款时刻获取其gps定位信息,以该gps为圆心,以3公里为覆盖范围,获取基站信息,反查基站所处地区在行政区域划分上是否为农村地区。
[0433]
以第一方是运营商为例,运营商区域常驻用户模型使用的运营商基站数据存在两种使用时间粒度,以天为粒度,以月为粒度,或者以天为粒度和以月为粒度二者结合,综合考虑监管要求及数据更新资源消耗以及模型精度要求,设定运营商目标用户业务数据的更新频率。
[0434]
若以天为数据使用粒度,则每天更新所使用的基站信息数据。
[0435]
若以月为数据使用粒度,则每月更新所使用的基站信息数据。当以月为粒度判定该用户当月是否为农村地区常驻用户时,可根据监管要求设定月度常驻天数阈值。举例说明:若监管要求某人一年内240天常驻农村,则判定为农村常驻人员,分布到月粒度,则某人一月内20天常驻农村,则判定该用户为农村常驻用户。
[0436]
若使用天、月结合的数据使用粒度。假设使用回退60天数据,以及回退10个月数据,可减轻数据迭代更新计算及存储压力。
[0437]
本实施例通过上述方案,具体通过获取目标用户移动设备连接的常驻基站的位置坐标;根据所述常驻基站的位置坐标,确认常驻基站所处区域为目标区域;根据预设的休息时间阈值,通过目标用户移动设备所处位置,生成目标用户在凌晨时段的常驻位置信息;根据预设的工作时间阈值,通过目标用户移动设备所处位置,生成目标用户在工作时段的常驻位置信息;接收用户贷款请求;根据所述用户贷款请求,获取目标用户申请贷款时移动设备的位置信息;根据所述目标用户申请贷款时移动设备的位置信息,获取预设范围内的基站位置坐标;根据所述预设范围内的基站位置坐标,确认预设范围内的基站所处区域为目标区域;根据所述目标用户在凌晨时段的常驻位置信息和目标用户在工作时段的常驻位置信息,得到所述第一方目标用户业务数据。由此,获得了第一方目标用户业务数据,为构建目标用户业务数据训练集提供了支持。
[0438]
参照图16,图16为本发明区域常驻用户识别方法第十五示例性实施例的流程示意图。
[0439]
基于上述图2所示的实施例,所述步骤s102,将所述待识别用户业务数据输入预先
训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到包括:
[0440]
步骤s1021,将所述待识别用户业务数据中的第一方待识别用户业务数据加密传输至所述第一方区域常驻用户识别模型进行识别,获取第一方用户识别结果;
[0441]
步骤s1022,将所述待识别用户业务数据中的第二方待识别用户业务数据加密传输至所述第二方区域常驻用户识别模型进行识别,获取第二方用户识别结果;
[0442]
步骤s1023,根据所述第一方用户识别结果和第二方用户识别结果,生成所述区域常驻用户识别结果。
[0443]
具体地,将双方的待识别用户业务数据分别输入到双方本地的联邦学习系统节点,加密传输至预先训练好的双方的区域常驻用户识别模型进行识别,最终得到区域常驻用户识别结果,采取以下步骤实现:
[0444]
首先,区域常驻用户识别装置将待识别用户业务数据中的第一方待识别用户业务数据加密传输至第一方区域常驻用户识别模型进行识别,获取第一方用户识别结果;
[0445]
其次,区域常驻用户识别装置将待识别用户业务数据中的第二方待识别用户业务数据加密传输至第二方区域常驻用户识别模型进行识别,获取第二方用户识别结果;
[0446]
最后,将第一方用户识别结果和第二方用户识别结果进行整合,生成区域常驻用户识别结果。
[0447]
本实施例通过上述方案,具体通过将所述待识别用户业务数据中的第一方待识别用户业务数据加密传输至所述第一方区域常驻用户识别模型进行识别,获取第一方用户识别结果;将所述待识别用户业务数据中的第二方待识别用户业务数据加密传输至所述第二方区域常驻用户识别模型进行识别,获取第二方用户识别结果;根据所述第一方用户识别结果和第二方用户识别结果,生成所述区域常驻用户识别结果。通过区域常驻用户识别模型,对区域常驻用户进行精确识别。由此,实现了对区域常驻用户的识别,解决了对区域常驻用户的识别精准度低的技术问题。相较于现有技术,具有精准度高、数据时效性强、数据安全性强的优势。
[0448]
此外,本发明还提供一种区域常驻用户识别装置,所述区域常驻用户识别装置包括:
[0449]
接收模块,用于接收待识别用户业务数据;
[0450]
识别分析模块,用于将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。
[0451]
本实施例实现区域常驻用户识别的原理请参照上述各实施例,在此不再赘述。
[0452]
此外,本发明实施例还提出一种终端设备,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的区域常驻用户识别程序,所述区域常驻用户识别程序被所述处理器执行时实现如上所述的区域常驻用户识别方法的步骤。
[0453]
由于区域常驻用户识别程序被处理器执行时,采用了前述所有实施例的全部技术方案,因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果,在此不再一一赘述。
[0454]
本发明实施例还提出一种计算器可读存储介质,所述计算机可读存储介质上存储
有区域常驻用户识别程序,所述区域常驻用户识别程序被处理器执行时实现如上所述的区域常驻用户识别方法的步骤。
[0455]
由于本区域常驻用户识别程序被处理器执行时,采用了前述所有实施例的全部技术方案,因此至少具有前述所有实施例的全部技术方案所带来的所有有益效果,在此不再一一赘述。
[0456]
相比现有技术,本发明实施例提出的区域常驻用户识别方案,通过接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。从而解决了现有的对区域常驻用户的识别准确度低的问题。基于本发明方案,从真实世界不能对区域常驻用户进行精准识别的问题出发,设计了一种区域常驻用户识别方案,并在区域常驻用户识别模型上验证了本发明的区域常驻用户识别方法的有效性,最后经过本发明方法对区域常驻用户进行识别具有更高的准确率。
[0457]
和现有的技术相比,本发明实施例方案具有以下优点:
[0458]
1、增强了数据的时效性。
[0459]
2、提高了区域常驻用户识别的准确率。
[0460]
3、降低了数据泄露及滥用风险。
[0461]
需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者系统不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者系统所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括该要素的过程、方法、物品或者系统中还存在另外的相同要素。
[0462]
上述本发明实施例序号仅仅为了描述,不代表实施例的优劣。
[0463]
通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到上述实施例方法可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件,但很多情况下前者是更佳的实施方式。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品存储在如上的一个存储介质(如rom/ram、磁碟、光盘)中,包括若干指令用以使得一台终端设备(可以是手机,计算机,服务器,被控终端,或者网络设备等)执行本发明每个实施例的方法。
[0464]
以上仅为本发明的优选实施例,并非因此限制本发明的专利范围,凡是利用本发明说明书及附图内容所作的等效结构或等效流程变换,或直接或间接运用在其他相关的技术领域,均同理包括在本发明的专利保护范围内。
技术特征:
1.一种区域常驻用户识别方法,其特征在于,所述区域常驻用户识别方法包括以下步骤:接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。2.如权利要求1所述的区域常驻用户识别方法,其特征在于,所述接收待识别用户业务数据的步骤之前,还包括:基于所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型。3.如权利要求2所述的区域常驻用户识别方法,其特征在于,所述基于所述纵向联邦学习技术及逻辑回归算法,进行模型训练得到所述区域常驻用户识别模型的步骤包括:基于隐私集合求交技术,构建目标用户业务数据训练集,所述目标用户业务数据训练集包括第一方目标用户业务数据和第二方目标用户业务数据;基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型;基于所述纵向联邦学习技术及逻辑回归算法,通过所述第二方目标用户业务数据更新第二方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第二方区域常驻用户识别模型。4.如权利要求3所述的区域常驻用户识别方法,其特征在于,所述基于所述隐私集合求交技术,构建目标用户业务数据训练集的步骤包括:获取用户身份数据,所述用户身份数据包括第一方用户身份数据和第二方用户身份数据;通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息;根据所述目标用户身份信息,获取所述第一方目标用户业务数据和第二方目标用户业务数据,建立所述目标用户业务数据训练集。5.如权利要求4所述的区域常驻用户识别方法,其特征在于,所述通过数据对齐服务器,对所述第一方用户身份数据和第二方用户身份数据进行数据对齐,获取目标用户身份信息的步骤包括:基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服务器,获取第一方目标用户身份信息;基于所述隐私集合求交技术,根据所述第二方用户身份数据,通过所述数据对齐服务器中的第二方数据对齐服务器,获取第二方目标用户身份信息;根据所述第一方目标用户身份信息和第二方目标用户身份信息,得到所述目标用户身份信息。6.如权利要求5所述的区域常驻用户识别方法,其特征在于,所述基于所述隐私集合求交技术,根据所述第一方用户身份数据,通过所述数据对齐服务器中的第一方数据对齐服
务器,获取第一方目标用户身份信息的步骤包括:将数据对齐加密条件和所述第一方用户身份数据输入所述第一方数据对齐服务器;根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第一方用户身份数据进行加密,生成第一方第一加密用户身份数据;通过所述第一方数据对齐服务器,将第一方第一加密用户身份数据发送到所述第二方数据对齐服务器;通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第二方第一加密用户身份数据;根据所述第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。7.如权利要求6所述的区域常驻用户识别方法,其特征在于,所述根据所述第一方第一加密用户身份数据和第二方第一加密用户身份数据,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息的步骤包括:根据所述数据对齐加密条件,通过所述第一方数据对齐服务器,对所述第二方第一加密用户身份数据进行加密,生成第二方第二加密用户身份数据;通过所述第一方数据对齐服务器,将所述第二方第二加密用户身份数据发送到所述第二方数据对齐服务器;通过所述第一方数据对齐服务器,接收所述第二方数据对齐服务器发送的第一方第二加密用户身份数据;对所述第一方第二加密用户身份数据和第二方第二加密用户身份数据取交集,通过所述第一方数据对齐服务器,得到所述第一方目标用户身份信息。8.如权利要求3所述的区域常驻用户识别方法,其特征在于,所述基于所述纵向联邦学习技术及逻辑回归算法,通过所述第一方目标用户业务数据更新第一方区域常驻用户识别模型参数,训练所述区域常驻用户识别模型中的第一方区域常驻用户识别模型的步骤包括:根据所述第一方目标用户业务数据,得到第一方加密目标用户业务数据;根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据;基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。9.如权利要求8所述的区域常驻用户识别方法,其特征在于,所述根据所述第一方目标用户业务数据,得到第一方加密目标用户业务数据的步骤包括:将第一加密条件和所述第一方目标用户业务数据输入第一方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,将所述第一加密条件发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二加密条件;通过所述第一方区域常驻用户识别模型,对所述第一方目标用户业务数据进行初始化;基于第一预设条件,根据所述初始化的第一方目标用户业务数据,计算得到第一加权
特征值;根据所述第一加密条件,通过所述第一方区域常驻用户识别模型,对所述第一加权特征值进行加密,生成所述第一方加密目标用户业务数据。10.如权利要求9所述的区域常驻用户识别方法,其特征在于,所述根据所述第一方加密目标用户业务数据,得到双方第一目标用户业务数据的步骤包括:通过所述第一方区域常驻用户识别模型,将所述第一方加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的第二方加密目标用户业务数据;根据所述第二加密条件,通过所述第一方区域常驻用户识别模型,对所述第一方加密目标用户业务数据和第二方加密目标用户业务数据进行加密,生成双方第一加密目标用户业务数据;根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据。11.如权利要求10所述的区域常驻用户识别方法,其特征在于,所述根据所述双方第一加密目标用户业务数据,通过所述第一方区域常驻用户识别模型,获取所述双方第一目标用户业务数据的步骤包括:通过所述第一方区域常驻用户识别模型,将所述双方第一加密目标用户业务数据发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的双方第二加密目标用户业务数据;根据所述第一加密条件和第二加密条件,通过所述第一方区域常驻用户识别模型,对所述双方第二加密目标用户业务数据进行解密,获取双方第二目标用户业务数据;通过所述第一方区域常驻用户识别模型,将所述双方第二目标用户业务数据发送到所述第二方区域常驻用户识别模型;通过所述第一方区域常驻用户识别模型,接收所述第二方区域常驻用户识别模型发送的所述双方第一目标用户业务数据。12.如权利要求8所述的区域常驻用户识别方法,其特征在于,所述基于所述逻辑回归算法,根据所述双方第一目标用户业务数据更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型的步骤包括:基于所述逻辑回归算法,根据所述双方第一目标用户业务数据,计算得到第一梯度值;根据所述第一梯度值,通过梯度下降法更新所述第一方区域常驻用户识别模型参数,训练所述第一方区域常驻用户识别模型。13.如权利要求3所述的区域常驻用户识别方法,其特征在于,所述基于所述隐私集合求交技术,构建目标用户业务数据训练集的步骤之前,还包括:采集所述第一方目标用户业务数据和第二方目标用户业务数据。14.如权利要求13所述的区域常驻用户识别方法,其特征在于,所述采集所述第一方目标用户业务数据和第二方目标用户业务数据的步骤包括:采集所述第一方目标用户业务数据;
获取目标用户移动设备连接的常驻基站的位置坐标;根据所述常驻基站的位置坐标,确认常驻基站所处区域为目标区域;根据预设的休息时间阈值,通过目标用户移动设备所处位置,生成目标用户在凌晨时段的常驻位置信息;根据预设的工作时间阈值,通过目标用户移动设备所处位置,生成目标用户在工作时段的常驻位置信息;根据所述目标用户在凌晨时段的常驻位置信息和目标用户在工作时段的常驻位置信息,得到第二方目标用户业务数据。15.如权利要求14所述的区域常驻用户识别方法,其特征在于,所述根据预设的工作时间阈值,通过目标用户移动设备所处位置,生成目标用户在工作时段的常驻位置信息的步骤之后,还包括:接收用户贷款请求;根据所述用户贷款请求,获取目标用户申请贷款时移动设备的位置信息;根据所述目标用户申请贷款时移动设备的位置信息,获取预设范围内的基站位置坐标;根据所述预设范围内的基站位置坐标,确认预设范围内的基站所处区域为目标区域。16.如权利要求3所述的区域常驻用户识别方法,其特征在于,所述将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果的步骤包括:将所述待识别用户业务数据中的第一方待识别用户业务数据加密传输至所述第一方区域常驻用户识别模型进行识别,获取第一方用户识别结果;将所述待识别用户业务数据中的第二方待识别用户业务数据加密传输至所述第二方区域常驻用户识别模型进行识别,获取第二方用户识别结果;根据所述第一方用户识别结果和第二方用户识别结果,生成所述区域常驻用户识别结果。17.一种区域常驻用户识别装置,其特征在于,所述区域常驻用户识别装置包括:接收模块,用于接收待识别用户业务数据;识别分析模块,用于将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。18.一种终端设备,其特征在于,所述终端设备包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的区域常驻用户识别程序,所述区域常驻用户识别程序被所述处理器执行时实现如权利要求1-16中任一项所述的区域常驻用户识别方法的步骤。19.一种计算器可读存储介质,其特征在于,所述计算机可读存储介质上存储有区域常驻用户识别程序,所述区域常驻用户识别程序被处理器执行时实现如权利要求1-16中任一项所述的区域常驻用户识别方法的步骤。
技术总结
本发明公开了一种区域常驻用户识别方法、装置、设备及存储介质,属于计算机技术领域。该方法包括:接收待识别用户业务数据;将所述待识别用户业务数据输入预先训练好的区域常驻用户识别模型进行识别,得到区域常驻用户识别结果,其中,所述区域常驻用户识别模型基于纵向联邦学习技术及逻辑回归算法训练得到。通过建立区域常驻用户识别模型,对区域常驻用户进行精确识别。由此,实现了对区域常驻用户的识别,解决了对区域常驻用户的识别精准度低的技术问题。相较于现有技术,具有精准度高、数据时效性强、数据安全性强的优势。数据安全性强的优势。数据安全性强的优势。
技术研发人员:张康
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2023.07.18
技术公布日:2023/10/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种电池盖板预铆快装治具的制作方法 下一篇:一种土地整治用夯实装置的制作方法