一种联合学习的资源分配方法及装置与流程

未命名 08-01 阅读:90 评论:0


1.本公开涉及机器学习技术领域,尤其涉及一种联合学习的资源分配方法及装置。


背景技术:

2.在隐私和数据保护问题日益受到重视的大环境下,联合学习已经成为人工智能领域中的一个非常热门的研究方向。联合学习是指在确保数据安全及用户隐私的前提下,综合利用多种ai(artificial intelligence,人工智能)技术,联合多方合作共同挖掘数据价值,催生基于联合建模的新的智能业态和模式。
3.对于联合学习而言,参与方持续地参与到联合学习进程(例如,通过共享加密的模型参数)是其长期成功的关键所在。然而,在现有技术中,联合学习的评估奖励机制大多是采用平均分配的方式,难免会存在分配不合理、不公平等问题,这就容易因激励分配不公平等原因而流失掉部分拥有充分且有效数据的参与方,这无疑将会不利于联合学习的长期良好可持续发展。


技术实现要素:

4.有鉴于此,本公开实施例提供了一种联合学习的资源分配方法及装置,以解决现有技术中联合学习的评估奖励机制大多是采用平均分配的方式,难免会存在分配不合理、不公平等问题,容易导致因激励分配不公平等原因而流失掉部分拥有充分且有效数据的参与方,不利于联合学习的长期良好可持续发展的问题。
5.本公开实施例的第一方面,提供了一种联合学习的资源分配方法,包括:
6.读取预设的资源分配配置信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;
7.获取多个模型需求方提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方;
8.确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量;
9.根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方。
10.本公开实施例的第二方面,提供了一种联合学习的资源分配装置,包括:
11.读取模块,被配置为读取预设的资源分配配置信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;
12.需求方确定模块,被配置为获取多个模型需求方提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方;
13.资源获取模块,被配置为确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量;
14.分配模块,被配置为根据属性配置信息、贡献度配置信息、监控配置信息及模型资
源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方。
15.本公开实施例的第三方面,提供了一种电子设备,包括存储器、处理器以及存储在存储器中并且可在处理器上运行的计算机程序,该处理器执行计算机程序时实现上述方法的步骤。
16.本公开实施例的第四方面,提供了一种计算机可读存储介质,该计算机可读存储介质存储有计算机程序,该计算机程序被处理器执行时实现上述方法的步骤。
17.本公开实施例与现有技术相比,有益效果至少包括:本公开实施例通过读取预设的资源分配配置信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;获取多个模型需求方提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方;确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量;根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方,充分考虑到各个目标资源贡献方的对模型需求方所需要的模型的效用的贡献度等方面因素,使得各个目标资源贡献方能够得到与其所提供的模型资源相匹配的分配值,不仅可激发资源贡献方提供模型资源的积极性,还可以进一步约束资源贡献方提供真实、有效的模型参数,以利于联合学习的长期良好可持续发展。
附图说明
18.为了更清楚地说明本公开实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。
19.图1是本公开实施例的合学习的架构(仿真平台)示意图;
20.图2是本公开实施例提供的一种联合学习的资源分配方法的流程示意图;
21.图3是本公开实施例提供的一种联合学习的资源分配装置的结构示意图;
22.图4是本公开实施例提供的一种电子设备的结构示意图。
具体实施方式
23.以下描述中,为了说明而不是为了限定,提出了诸如特定系统结构、技术之类的具体细节,以便透彻理解本公开实施例。然而,本领域的技术人员应当清楚,在没有这些具体细节的其它实施例中也可以实现本公开。在其它情况中,省略对众所周知的系统、装置、电路以及方法的详细说明,以免不必要的细节妨碍本公开的描述。
24.联合学习是指在确保数据安全及用户隐私的前提下,综合利用多种ai(artificial intelligence,人工智能)技术,联合多方合作共同挖掘数据价值,催生基于联合建模的新的智能业态和模式。联合学习至少具有以下特点:
25.(1)参与节点控制自有数据的弱中心化联合训练模式,确保共创智能过程中的数据隐私安全。
26.(2)在不同应用场景下,利用筛选和/或组合ai算法、隐私保护计算,建立多种模型聚合优化策略,以获取高层次、高质量的模型。
27.(3)在确保数据安全及用户隐私的前提下,基于多种模型聚合优化策略,获取提升联合学习引擎的效能方法,其中效能方法可以是通过解决包括计算架构并行、大规模跨域网络下的信息交互、智能感知、异常处理机制等,提升联合学习引擎的整体效能。
28.(4)获取各场景下多方用户的需求,通过互信机制,确定合理评估各联合参与方的真实贡献度,进行分配激励。
29.基于上述方式,可以建立基于联合学习的ai技术生态,充分发挥行业数据价值,推动垂直领域的场景落地。
30.下面将结合附图详细说明根据本公开实施例的一种联合学习的资源分配方法和装置。
31.图1是本公开实施例的一种联合学习的架构(仿真平台)示意图。如图1所示,联合学习的架构(仿真平台)可以包括服务器(资源分配中心)101、多个目标资源贡献方102以及多个模型需求方103。
32.在联合学习过程中,可以预先通过人工配置该资源分配中心101在后续的仿真拍卖场景中可能会使用到的资源分配配置信息,该资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;在启动仿真拍卖程序时,资源分配中心101可读取预设的资源分配配置信息,然后,获取多个模型需求方103提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方;接着,进一步确定与模型需求信息匹配的多个目标资源贡献方102,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量;再根据上述属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方,从而完成整个模型资源拍卖流程。
33.本公开实施例充分考虑到各个目标资源贡献方的对模型需求方所需要的模型的效用的贡献度等方面因素,使得各个目标资源贡献方能够得到与其所提供的模型资源相匹配的分配值,不仅可激发资源贡献方提供模型资源的积极性,还可以进一步约束资源贡献方提供真实、有效的模型参数,以利于联合学习的长期良好可持续发展。
34.需要说明的是,目标资源方和模型需求方的数量和类型等可以根据实际情况具体设置,在本公开中不做具体限制。
35.图2是本公开实施例提供的一种联合学习的资源分配方法的流程示意图。图2的联合学习的资源分配方法可以由图1的资源分配中心101执行。如图2所示,该联合学习的资源分配方法包括:
36.步骤s201,读取预设的资源分配配置信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息。
37.作为一示例,资源分配配置信息可由人工预先配置具体的参数值得到,也可以由人工预先配置的参数范围值内随机产生。
38.具体的,属性配置信息,可包括拍卖方式,拍卖方式包括但不限于首价拍卖、vcg价格拍卖等。其中,首价拍卖,其原理是出价最高者胜出。vcg价格拍卖,其原理则是计算竞价者赢得拍卖品后,给整个竞价收入带来的收益损失,理论上这种损失就是竞价获胜者应该支付的费用。
39.贡献度配置信息,包括但不限于贡献度衡量方法,比如,按边际贡献分配(指各节
点的效益是它加入团队时所产生的效用)、基于shapely值分配(旨在排除节点以不同顺序加入集合体中所带来的影响,从而更公平地预估它们对集合体做出的贡献)。
40.监控配置信息,包括但不限于训练数据偏差(是指资源贡献方所提供的训练数据与模型需求方所需要的模型样本的偏差程度)、资源偏差(一般指资源贡献方所拥有的计算资源与训练模型时所需要的计算资源之间的偏差)、在线稳定度偏差(一般是指资源贡献方在参与联合训练过程中出现掉线的概率与预设的在线率的偏差)等。
41.作为一示例,可以通过与运行预设的计算机程序在平台内存中产生一个用于配置资源分配中心101这一对象的数据结构,该数据结构可以是“[属性配置信息,贡献度配置信息,监控配置信息]”这种一维数组的形式。
[0042]
步骤s202,获取多个模型需求方提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方。
[0043]
作为一示例,可以预先构建资源分配中心101与多个目标资源贡献方102和多个模型需求方103之间的通信通道。资源分配中心101可在启动仿真程序后,对该通信通道进行监听,并实现与多个目标资源贡献方102、多个模型需求方103的通信及信息交换。
[0044]
在一些实施例中,上述模型需求信息包括需求模型。根据属性配置信息和模型需求信息,确定目标需求方,具体包括:根据需求模型对多个模型需求方进行分类,得到与每个需求模型对应的模型需求方集合;根据属性配置信息,从模型需求方集合中筛选出目标需求方。
[0045]
具体的,在运行预设的模型拍卖仿真程序时,资源分配中心101可启动对通信通道的监听,并通过该通信通道接收多个模型需求方103提供的模型需求信息,该模型需求信息包括每个模型需求方的需求模型。这里的需求模型可以根据模型需求方的实际业务需求来确定,比如,模型需求方的业务需求是提高考勤系统的人脸识别准确性,那么其需求的模型可为人脸识别模型。
[0046]
接着,再根据所获取到的每个模型需求方的需求模型,对这些模型需求方进行分类,以获得与每个需求模型对应的模型需求方集合,该模型需求方集合包括至少一个模型需求方。
[0047]
示例性的,假设当前有5个模型需求方,分别为模型需求方a、b、c、d、e,其中,模型需求方a、b的需求模型为人脸识别模型,模型需求方c、d、e的需求模型为负荷预测模型。那么,可根据需求模型将上述的5个模型需求方分成两类,一类为与人脸识别模型对应的模型需求方集合01(包括模型需求方a、b),另一类为与负荷预测模型对应的模型需求方集合02(包括模型需求方c、d、e)。
[0048]
在一些实施例中,根据属性配置信息,从模型需求方集合中筛选出目标需求方,具体包括:获取模型需求方集合中的每个模型需求方的预算资源;将预算资源最多的模型需求方确定为目标需求方。
[0049]
假设给定的属性配置信息为首价拍卖,即价高者获胜。那么,可进一步获取每个模型需求方的预算资源,这里的预算资源可以是指预算费用,即购买其所需模型的预算。然后,比较每个模型需求方集合中的两两模型需求方之间的预算资源大小,并将其中预算资源最多(即出价最高)的模型需求方确定为目标需求方。
[0050]
示例性的,若模型需求方集合01中的模型需求方a的预算资源为x元,模型需求方b
的预算资源为y元,且x>y,则将模型需求方a确定为目标需求方。
[0051]
步骤s203,确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量。
[0052]
在一些实施例中,资源分配中心101可通过预设的通信通道广播模型招标信息,以使各个资源贡献方接收模型招标信息,模型招标信息包括需求模型、所需训练样本、所需样本数量和激励系数;接收多个资源贡献方基于模型招标信息反馈的待拍卖模型的模型信息。
[0053]
其中,所需训练样本类型,可根据需求模型确定,假设需求模型为人脸识别模型,那么其所需训练样本可为包含人脸的图片/图像/视频。所需样本数量,通常是指至少满足一轮次联合训练需求的样本量。比如,一轮训练需要100条样本,那么所需样本数量则为100条。
[0054]
激励系数,与训练样本和需求模型的关联度有关,通常关联度越高,对应的激励系数越大。作为一示例,假设所需训练样本为包含人脸的图片/图像/视频,那么包含人脸的图片/图像/视频的训练样本,可视为关联度较高的样本,其所对应的激励系数可设置为0.8,而不包含人脸的图片/图像/视频的训练样本,可视为关联度较低(或者不关联)的样本,其所对应的激励系数可设置为0.2。
[0055]
作为一示例,当资源贡献方(拥有训练数据的参与方)通过上述通信通道接收到资源分配中心101广播的模型招标信息为需求模型为人脸识别模型、所需训练样本(包含人脸的图片/图像/视频)、所需样本数量(一轮次100条样本)和激励系数(含人脸的图片/图像/视频的样本的激励系数为0.8,不含人脸的图片/图像/视频的样本的激励系数为0.2)时,可以根据其自身拥有的训练数据以及上述模型招标信息,确定其是否参与本次投标竞拍活动。
[0056]
在一些实施例中,可先获取多个资源贡献方上报的待拍卖模型的模型信息,待拍卖模型的模型信息包括待拍卖模型的模型类型;再计算待拍卖模型的模型类型与需求模型的模型类型之间的相似度,最后,根据相似度确定与需求模型的模型类型相匹配的多个目标资源贡献方。
[0057]
作为一示例,根据上述模型招标信息,结合自身拥有的训练数据,确定参与本次投标竞拍活动的资源贡献方,可以使用其拥有的训练数据训练资源分配中心101下发的基本模型,得到训练模型,并将该训练模型的模型信息(即待拍卖模型的模型信息)反馈给资源分配中心101。
[0058]
作为一示例,资源分配中心101在获取到各个资源贡献方上报的待拍卖模型的模型信息(包括待拍卖模型的模型类型)后,可进一步计算每个资源贡献方上报的待拍卖模型的模型类型与需求模型的模型类型之间的相似度(比如,余弦相似度),再按照相似度从大到小对各个资源贡献方进行排序,得到排序列表。最后,根据实际需要,按排序列表的顺序依次选取至少两个资源贡献方作为目标资源贡献方。
[0059]
步骤s204,根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方。
[0060]
在一些实施例中,根据属性配置信息和预设的第一权重,计算每个目标资源贡献方的拍卖值;
[0061]
根据贡献度配置信息、模型参数、有效训练数据量及预设的第二权重,计算每个目标资源贡献方的贡献值;
[0062]
根据监控配置信息和预设的第三权重,计算每个目标资源贡献方的惩罚值;
[0063]
根据拍卖值、贡献值和惩罚值,确定每个目标资源贡献方对应的分配值。
[0064]
其中,第一权重、第二权重和第三权重可以根据实际情况灵活设置,具体在此不做限制。例如,第一权重、第二权重和第三权重可以分别设置为0.5、0.3、0.2。
[0065]
作为一示例,根据属性配置信息和预设的第一权重,计算每个目标资源贡献方的拍卖值。具体的,可以根据拍卖方式所对应的定价及其对应的预设第一权重值来计算出拍卖值。比如,拍卖方式为首价拍卖,首价拍卖的定价可为目标需求方提供的预算资源扣除资源分配中心的服务成本之后的剩余部分。
[0066]
有效训练数据量,是指与目标需求方所需要的模型的关联度达到预设关联度阈值的训练数据的数量。比如,目标需求方所需要的模型为人脸识别模型,那么与人脸识别模型关联的训练数据是包含人脸的图像/图片/视频。预设的关联度阈值可以根据实际情况设置,如可以设置为50%、100%等。示例性,假设包含人脸的图像/图片/视频的训练数据与人脸识别模型的关联度为100%,不包含人脸的图像/图片/视频的训练数据与人脸识别模型的关联度为0%,预设的关联度阈值可以设置为100%。也就是说,该示例中的有效训练数据量,是指与目标需求方所需要的人脸识别模型的关联度达到100%(即包含人脸的图像/图片/视频的训练数据)的条数。
[0067]
一般地,当训练模型为深度神经网络模型,其模型参数一般包括权重和偏置。
[0068]
作为一示例,根据贡献度配置信息、模型参数、有效训练数据量及预设的第二权重,计算每个目标资源贡献方的贡献值。具体的,可以将资源贡献方提供的模型参数更新资源分配中心处存储的目标需求方所需的模型的迭代模型,然后,用预存的测试数据对更新后的迭代模型进行推演测试,以确定该资源贡献方所提供的模型参数对该迭代模型的性能改善的程度。通常改善程度越高,则证明该资源贡献方的贡献度越高,贡献值也就越高。同理,当资源贡献方所提供的有效训练数据量越多,则对模型性能的改善的贡献则越大,贡献值也就越高。
[0069]
在实际应用中,可以根据预先配置的贡献度衡量方法(如按边际贡献分配),以及各资源贡献方所提供的模型参数、有效训练数据量和预设的第二权重,计算出各资源贡献方的贡献值。
[0070]
在一些实施例中,根据监控配置信息和预设的第三权重,计算每个目标资源贡献方的惩罚值,具体包括:
[0071]
确定每个目标资源贡献方的第一惩罚项、第二惩罚项和第三惩罚项;
[0072]
根据第一惩罚项、第二惩罚项和第三惩罚项,计算每个目标资源贡献方的惩罚值。
[0073]
惩罚值,主要是为了惩罚资源贡献方提供不真实或者无效的模型信息而设置的。
[0074]
其中,第一惩罚项可以是训练数据偏差,第二惩罚项可以是资源偏差,第三惩罚项可以是在线稳定度偏差。
[0075]
对于上述每种偏差项可以根据其偏差对模型性能的影响程度来确定其对应的惩罚权重。比如,第一惩罚项对模型性能的影响程度>第二惩罚项>第三惩罚项,那么第一惩罚项、第二惩罚项和第三惩罚项的惩罚权重可分别设置为0.7、0.2、0.1。需要说明的是,惩
罚权重可以根据实际情况灵活设置,在此不做具体限制。
[0076]
作为一示例,可根据公式:惩罚值=第一惩罚项*第一惩罚权重+第二惩罚项*第二惩罚权重+第三惩罚项*第三惩罚权重,计算每个资源贡献方的惩罚值。
[0077]
之后,再根据公式:分配值=拍卖值+贡献值-惩罚值,计算出每个目标资源贡献方对应的分配值。
[0078]
本公开实施例提供的技术方案,通过读取预设的资源分配配置信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;获取多个模型需求方提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方;确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量;根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方,充分考虑到各个目标资源贡献方的对模型需求方所需要的模型的效用的贡献度等方面因素,使得各个目标资源贡献方能够得到与其所提供的模型资源相匹配的分配值,不仅可激发资源贡献方提供模型资源的积极性,还可以进一步约束资源贡献方提供真实、有效的模型参数,以利于联合学习的长期良好可持续发展。
[0079]
上述所有可选技术方案,可以采用任意结合形成本技术的可选实施例,在此不再一一赘述。
[0080]
下述为本公开装置实施例,可以用于执行本公开方法实施例。对于本公开装置实施例中未披露的细节,请参照本公开方法实施例。
[0081]
图3是本公开实施例提供的一种联合学习的资源分配装置的示意图。如图3所示,该联合学习的资源分配装置包括:
[0082]
读取模块301,被配置为读取预设的资源分配配置信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;
[0083]
需求方确定模块302,被配置为获取多个模型需求方提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方;
[0084]
资源获取模块303,被配置为确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量;
[0085]
分配模块304,被配置为根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方。
[0086]
本公开实施例提供的技术方案,通过读取模块301读取预设的资源分配配置信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;需求方确定模块302获取多个模型需求方提供的模型需求信息,根据属性配置信息和模型需求信息,确定目标需求方;资源获取模块303确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源,模型资源包括模型参数及有效训练数据量;分配模块304根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,并将分配值反馈至各个目标资源贡献方,充分考虑到各个目标资源贡献方的对模型需求方所需要的模型的效用的贡献度等方面因素,使得各个目标资源贡献方能够得到与其所提供的模型资源相匹配的分配值,不仅可激发资源贡献方提供模型资源的积极性,还可以进一步约束资源贡献方提供真实、有效的模型参数,以利于联合学习的长期良好可持
续发展。
[0087]
在一些实施例中,上述模型需求信息包括需求模型。上述步骤,根据属性配置信息和模型需求信息,确定目标需求方,包括:
[0088]
根据需求模型对多个模型需求方进行分类,得到与每个需求模型对应的模型需求方集合;
[0089]
根据属性配置信息,从模型需求方集合中筛选出目标需求方。
[0090]
在一些实施例中,上述步骤,据属性配置信息,从模型需求方集合中筛选出目标需求方,包括:
[0091]
获取模型需求方集合中的每个模型需求方的预算资源;
[0092]
将预算资源最多的模型需求方确定为目标需求方。
[0093]
在一些实施例中,上述步骤,确定与模型需求信息匹配的多个目标资源贡献方,包括:
[0094]
获取多个资源贡献方上报的待拍卖模型的模型信息,待拍卖模型的模型信息包括待拍卖模型的模型类型;
[0095]
计算待拍卖模型的模型类型与需求模型的模型类型之间的相似度,根据相似度确定与需求模型的模型类型相匹配的多个目标资源贡献方。
[0096]
在一些实施例中,上述步骤,获取多个资源贡献方上报的待拍卖模型的模型信息之前,还包括:
[0097]
通过预设的通信通道广播模型招标信息,以使各个资源贡献方接收模型招标信息,模型招标信息包括需求模型、所需训练样本、所需样本数量和激励系数;
[0098]
接收多个资源贡献方基于模型招标信息反馈的待拍卖模型的模型信息。
[0099]
在一些实施例中,上述步骤,根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值,包括:
[0100]
根据属性配置信息和预设的第一权重,计算每个目标资源贡献方的拍卖值;
[0101]
根据贡献度配置信息、模型参数、有效训练数据量及预设的第二权重,计算每个目标资源贡献方的贡献值;
[0102]
根据监控配置信息和预设的第三权重,计算每个目标资源贡献方的惩罚值;
[0103]
根据拍卖值、贡献值和惩罚值,确定每个目标资源贡献方对应的分配值。
[0104]
在一些实施例中,上述步骤,根据监控配置信息和预设的第三权重,计算每个目标资源贡献方的惩罚值,包括:
[0105]
确定每个目标资源贡献方的第一惩罚项、第二惩罚项和第三惩罚项;
[0106]
根据第一惩罚项、第二惩罚项和第三惩罚项,计算每个目标资源贡献方的惩罚值。
[0107]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本公开实施例的实施过程构成任何限定。
[0108]
图4是本公开实施例提供的电子设备400的示意图。如图4所示,该实施例的电子设备400包括:处理器401、存储器402以及存储在该存储器402中并且可在处理器401上运行的计算机程序403。处理器401执行计算机程序403时实现上述各个方法实施例中的步骤。或者,处理器401执行计算机程序403时实现上述各装置实施例中各模块/单元的功能。
[0109]
示例性地,计算机程序403可以被分割成一个或多个模块/单元,一个或多个模块/单元被存储在存储器402中,并由处理器401执行,以完成本公开。一个或多个模块/单元可以是能够完成特定功能的一系列计算机程序指令段,该指令段用于描述计算机程序403在电子设备400中的执行过程。
[0110]
电子设备400可以是桌上型计算机、笔记本、掌上电脑及云端服务器等电子设备。电子设备400可以包括但不仅限于处理器401和存储器402。本领域技术人员可以理解,图4仅仅是电子设备400的示例,并不构成对电子设备400的限定,可以包括比图示更多或更少的部件,或者组合某些部件,或者不同的部件,例如,电子设备还可以包括输入输出设备、网络接入设备、总线等。
[0111]
处理器401可以是中央处理单元(central processing unit,cpu),也可以是其它通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现场可编程门阵列(field-programmable gate array,fpga)或者其它可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件等。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。
[0112]
存储器402可以是电子设备400的内部存储单元,例如,电子设备400的硬盘或内存。存储器402也可以是电子设备400的外部存储设备,例如,电子设备400上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,存储器402还可以既包括电子设备400的内部存储单元也包括外部存储设备。存储器402用于存储计算机程序以及电子设备所需的其它程序和数据。存储器402还可以用于暂时地存储已经输出或者将要输出的数据。
[0113]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。实施例中的各功能单元、模块可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中,上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。另外,各功能单元、模块的具体名称也只是为了便于相互区分,并不用于限制本技术的保护范围。上述系统中单元、模块的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
[0114]
在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述或记载的部分,可以参见其它实施例的相关描述。
[0115]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本公开的范围。
[0116]
在本公开所提供的实施例中,应该理解到,所揭露的装置/电子设备和方法,可以通过其它的方式实现。例如,以上所描述的装置/电子设备实施例仅仅是示意性的,例如,模块或单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,多个单元
或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通讯连接可以是通过一些接口,装置或单元的间接耦合或通讯连接,可以是电性,机械或其它的形式。
[0117]
作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
[0118]
另外,在本公开各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0119]
集成的模块/单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读存储介质中。基于这样的理解,本公开实现上述实施例方法中的全部或部分流程,也可以通过计算机程序来指令相关的硬件来完成,计算机程序可以存储在计算机可读存储介质中,该计算机程序在被处理器执行时,可以实现上述各个方法实施例的步骤。计算机程序可以包括计算机程序代码,计算机程序代码可以为源代码形式、对象代码形式、可执行文件或某些中间形式等。计算机可读介质可以包括:能够携带计算机程序代码的任何实体或装置、记录介质、u盘、移动硬盘、磁碟、光盘、计算机存储器、只读存储器(read-only memory,rom)、随机存取存储器(random access memory,ram)、电载波信号、电信信号以及软件分发介质等。需要说明的是,计算机可读介质包含的内容可以根据司法管辖区内立法和专利实践的要求进行适当的增减,例如,在某些司法管辖区,根据立法和专利实践,计算机可读介质不包括电载波信号和电信信号。
[0120]
以上实施例仅用以说明本公开的技术方案,而非对其限制;尽管参照前述实施例对本公开进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本公开各实施例技术方案的精神和范围,均应包含在本公开的保护范围之内。

技术特征:
1.一种联合学习的资源分配方法,其特征在于,包括:读取预设的资源分配配置信息,所述资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;获取多个模型需求方提供的模型需求信息,根据所述属性配置信息和所述模型需求信息,确定目标需求方;确定与所述模型需求信息匹配的多个目标资源贡献方,获取每个所述目标资源贡献方的模型资源,所述模型资源包括模型参数及有效训练数据量;根据所述属性配置信息、贡献度配置信息、监控配置信息及所述模型资源,确定每个所述目标资源贡献方对应的分配值,并将所述分配值反馈至各个所述目标资源贡献方。2.根据权利要求1所述的方法,其特征在于,所述模型需求信息包括需求模型;所述根据所述属性配置信息和所述模型需求信息,确定目标需求方,包括:根据所述需求模型对所述多个模型需求方进行分类,得到与每个所述需求模型对应的模型需求方集合;根据所述属性配置信息,从所述模型需求方集合中筛选出目标需求方。3.根据权利要求2所述的方法,其特征在于,所述根据所述属性配置信息,从所述模型需求方集合中筛选出目标需求方,包括:获取所述模型需求方集合中的每个模型需求方的预算资源;将所述预算资源最多的模型需求方确定为目标需求方。4.根据权利要求2所述的方法,其特征在于,所述确定与所述模型需求信息匹配的多个目标资源贡献方,包括:获取多个资源贡献方上报的待拍卖模型的模型信息,所述待拍卖模型的模型信息包括待拍卖模型的模型类型;计算所述待拍卖模型的模型类型与所述需求模型的模型类型之间的相似度,根据所述相似度确定与所述需求模型的模型类型相匹配的多个目标资源贡献方。5.根据权利要求4所述的方法,其特征在于,所述获取所述多个资源贡献方上报的待拍卖模型的模型信息之前,还包括:通过预设的通信通道广播模型招标信息,以使各个资源贡献方接收所述模型招标信息,所述模型招标信息包括需求模型、所需训练样本、所需样本数量和激励系数;接收多个资源贡献方基于所述模型招标信息反馈的待拍卖模型的模型信息。6.根据权利要求1所述的方法,其特征在于,所述根据所述属性配置信息、贡献度配置信息、监控配置信息及所述模型资源,确定每个所述目标资源贡献方对应的分配值,包括:根据所述属性配置信息和预设的第一权重,计算每个所述目标资源贡献方的拍卖值;根据所述贡献度配置信息、所述模型参数、有效训练数据量及预设的第二权重,计算每个所述目标资源贡献方的贡献值;根据所述监控配置信息和预设的第三权重,计算每个所述目标资源贡献方的惩罚值;根据所述拍卖值、贡献值和惩罚值,确定每个所述目标资源贡献方对应的分配值。7.根据权利要求6所述的方法,其特征在于,所述根据所述监控配置信息和预设的第三权重,计算每个所述目标资源贡献方的惩罚值,包括:确定每个所述目标资源贡献方的第一惩罚项、第二惩罚项和第三惩罚项;
根据所述第一惩罚项、第二惩罚项和第三惩罚项,计算每个所述目标资源贡献方的惩罚值。8.一种联合学习的资源分配装置,其特征在于,包括:读取模块,被配置为读取预设的资源分配配置信息,所述资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息;需求方确定模块,被配置为获取多个模型需求方提供的模型需求信息,根据所述属性配置信息和所述模型需求信息,确定目标需求方;资源获取模块,被配置为确定与所述模型需求信息匹配的多个目标资源贡献方,获取每个所述目标资源贡献方的模型资源,所述模型资源包括模型参数及有效训练数据量;分配模块,被配置为根据所述属性配置信息、贡献度配置信息、监控配置信息及所述模型资源,确定每个所述目标资源贡献方对应的分配值,并将所述分配值反馈至各个所述目标资源贡献方。9.一种电子设备,包括存储器、处理器以及存储在所述存储器中并且可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至7中任一项所述方法的步骤。10.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。

技术总结
本公开涉及机器学习技术领域,提供了一种联合学习的资源分配方法及装置。该方法包括:读取预设的资源分配配置信息;获取多个模型需求方提供的模型需求信息,资源分配配置信息包括属性配置信息、贡献度配置信息及监控配置信息,根据属性配置信息和模型需求信息,确定目标需求方;确定与模型需求信息匹配的多个目标资源贡献方,获取每个目标资源贡献方的模型资源;根据属性配置信息、贡献度配置信息、监控配置信息及模型资源,确定每个目标资源贡献方对应的分配值。本公开能够使得各个目标资源贡献方得到与其所提供的模型资源相匹配的分配值,激发了资源贡献方提供模型资源的积极性,有利于联合学习的长期良好可持续发展。于联合学习的长期良好可持续发展。于联合学习的长期良好可持续发展。


技术研发人员:刘嘉 李增祥
受保护的技术使用者:新智我来网络科技有限公司
技术研发日:2022.01.17
技术公布日:2023/7/31
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐