基于多指标融合的基础设施网络攻防博弈策略生成方法
未命名
10-08
阅读:59
评论:0

1.本发明涉及系统工程中的复杂网络博弈技术领域,尤其涉及基于多指标融合的基础设施网络攻防博弈策略生成方法。
背景技术:
2.在当前博弈论的研究领域,有一类特殊的网络博弈,其中的网络并不是计算机系统等实际存在的网络,而是将关键基础设施,比如火车站点、飞机场等抽象成网络拓扑结构中的节点,将不同站点之间的联系抽象成边,建立基础设施复杂网络。在安防领域,基础设施的关键节点容易受到攻击,对治安管理和正常社会生活会造成影响,安防部门需要对这些节点进行防护。可以采用复杂网络博弈来研究基础设施网络中关键节点的攻击和防护问题,有助于制定最佳防护策略,探索节点的重要性。
3.现有的网络攻防博弈研究只给出了一种基于网络拓扑结构的客观评价方法,不能融合决策者的主观判断,不能表达实际问题的模糊性与综合性。比如在完全信息静态或动态博弈框架下,利用网络连通性能指标——最大连通片规模计算攻击方和防御方的收益矩阵,并计算相应的纳什均衡策略。但是在此类实际的博弈问题中,博弈参与双方对问题的理解并不确定,获得信息不足,决策环境变幻莫测,考虑因素较多,现有方法并不能很好地综合融入决策者的主观判断,不能表达实际博弈问题的模糊性和综合性。
4.zadeh教授提出了模糊集理论,为解决这类问题提供了一条合理的途径。针对模糊集合论的局限性和表达犹豫的实际需要,atanassov提出了直觉模糊集理论,它用两个尺度(隶属度和非隶属度)来表示模糊现象的支持、反对和犹豫。这一理论的提出为解决更复杂的博弈问题提供了启示。同时,为了综合考虑决策者的主观判断,将多指标按权重融合形成新的收益矩阵,可以更好地考虑因素之间的关系和权重,减少不确定性对博弈结果的影响,使得结果更贴近实际情况。
技术实现要素:
5.本发明旨在至少解决现有技术中存在的技术问题之一。为此,本发明公开了基于多指标融合的基础设施网络攻防博弈策略生成方法。所述方法基于二人零和博弈,利用双曲隶属度/非隶属度函数生成直觉模糊集收益矩阵,在此基础上,将多指标进行融合,按不同权重生成新的收益矩阵。并采用一种有效的算法求解纳什均衡解,最终获得双方策略的优化方法和结果。
6.本发明的目的是通过如下技术方案实现的,基于多指标融合的基础设施网络攻防博弈策略生成方法,所述方法包括:
7.步骤1,获取基础设施网络的拓扑结构,攻击方和防御方分别为局中人1和局中人2,确定局中人1和局中人2的策略集合,构建基础设施网络博弈模型;
8.步骤2,分别以最大连通片规模、网络效率和聚集系数三个网络性能指标,计算基础设施网络博弈中局中人1和局中人2在各种策略剖面下的收益矩阵;
9.步骤3,根据决策者的偏好,构建最大连通片规模、网络效率和聚集系数三个网络性能指标对应的三对隶属度函数和非隶属度函数;
10.步骤4,利用三对隶属度函数和非隶属度函数,将步骤2中所述的收益矩阵转换为直觉模糊集收益矩阵,并用直觉模糊加权集结算子加权融合,得到最终收益矩阵;
11.步骤5,结合直觉模糊集理论,将基础设施网络博弈模型的求解转换为非线性规划问题的求解,得到局中人1和局中人2的混合策略纳什均衡解;
12.所述的基础设施网络表示为简单无向图g(v,e),其中v={v1,v2,...,vn}代表基础设施网络中所有节点的集合,其中,n=|v|表示基础设施网络中的节点数量,是基础设施网络中所有边的集合。
13.具体地,所述的攻击方的攻击策略集合为sa,对于一个攻击策略向量sa=[x1,x2,...,xn]∈sa,xi表示第i个基础设施是否被攻击,记为攻击节点的集合,如果第i个节点vi被攻击,即vi∈va,xi=1,否则xi=0;所述的防御方的防御策略集合为sd,防御方的一个防御策略向量sd=[y1,y2,...,yn]∈sd,yi表示第i个基础设施是否被防御,记为防御节点的集合,如果第i个节点vi被防御,即vi∈vd,yi=1,否则yi=0,对于被攻击的节点vi,若同时存在xi=1且yi=0,即虽被攻击但是未被保护,则节点vi将被移除;
[0014]
对于第i个节点vi,记与分别为攻击方的攻击成本与防御方的防御成本,节点vi的攻击成本与防御成本分别表示为:
[0015][0016]
其中,ri表示节点vi的结构属性指标,qa表示攻击方的成本敏感系数,即节点的结构属性指标对攻击方的攻击成本的影响情况,qd表示防御方的成本敏感系数,即节点的结构属性指标对防御方的防御成本的影响情况;
[0017]
定义攻防双方的可用资源分别为:
[0018][0019][0020]
其中,ca表示攻击方的可用资源,cd表示防御方的可用资源;θa∈[0,1],θd∈[0,1]分别为攻击预算约束系数和防御预算约束系数;
[0021]
设攻击方的总攻击成本为c
x
,则:
[0022][0023]
攻击方总攻击成本是有限的,因此应满足约束:
[0024][0025]
防御方的总防御成本为cy,则:
[0026]
[0027]
所述的策略集合包括攻击方的攻击策略集合和防御方的防御策略集合,攻击方的攻击策略集合包括三种典型策略,即最大度攻击策略s
amax
∈sa、最小度攻击策略s
amin
∈sa、随机攻击策略s
arand
∈sa,最大度攻击策略按照节点度数从高到低的顺序进行攻击,最小度攻击策略按照节点度数从低到高的顺序进行攻击,随机攻击策略随机选择满足成本约束条件的节点进行攻击;防御方的防御策略集合包括三种典型策略,即最大度防御策略s
dmax
∈sd、最小度防御策略s
dmax
∈sd、随机防御策略s
drand
∈sd,最大度防御策略按照节点度数从高到低的顺序进行防御,最小度防御策略按照节点度数从低到高的顺序进行防御,随机防御策略随机选择满足成本约束条件的节点进行防御。
[0028]
进一步地,所述的结构属性指标为度、介数或者特征向量中心性。
[0029]
具体地,所述的收益矩阵包括攻击方的收益矩阵和防御方的收益矩阵,为攻击方在网络性能指标i下的收益函数,则表示攻击方在网络性能指标i下选择攻击策略x和防御方选择防御策略y时攻击方的收益,表示网络性能指标i下攻击方在选择攻击策略x和防御方选择防御策略y时防御方的收益,记i=1表示网络性能指标为最大连通片规模,i=2表示网络性能指标为网络效率,i=3表示网络性能指标为聚集系数,则有:
[0030][0031][0032][0033][0034][0035][0036]
其中,γ(g),e(g)和h(g)分别表示初始的基础设施网络的最大连通片规模,网络效率和聚集系数,记所有被移除的节点组成的集合为节点被移除后组成的网络为是节点被移除后组成的基础设施网络中所有边的集合,和表示进行一轮博弈后基础设施网络的最大连通片规模,网络效率和聚集系数,且满足和聚集系数,且满足
[0037]
更进一步地,网络性能指标i对应下的隶属度函数和非隶属度函数的采取双曲线隶属度函数μi(x)和非隶属度函数νi(x)的形式:
[0038][0039][0040]
其中,α表示最高可接受水平,β表示最低可接受水平;
[0041]
攻击方选取攻击策略集合sa中的一个攻击策略s
amax
,s
amin
,s
arand
∈sa,防御方选取防御策略集合sd中的一个防御策略s
dmax
,s
dmin
,s
drand
∈sd,当网络性能指标为最大连通片规模时,i=1,攻击方的原有收益值表示为:
[0042][0043]
其中,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之前的最大联通片规模,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之后的最大联通片规模,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,最大连通片规模网络性能指标对应的攻击方在不同策略局势下的直觉模糊集收益矩阵表示为:
[0044][0045]
其中,μ
1amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时最大联通片规模的收益值隶属度,ν
1amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时最大联通片规模的收益值非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标1表示以最大联通片规模为网络性能指标;
[0046]
当网络性能指标为网络效率时,i=2,攻击方的原有收益值表示为:
[0047][0048]
其中,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之前的网络效率,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之后的
网络效率,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,网络效率网络性能指标对应的攻击方在不同纯策略局势下的直觉模糊集收益矩阵表示为:
[0049][0050]
其中,μ
2amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,网络效率收益值的隶属度,ν
2amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,网络效率收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标2表示以网络效率为网络性能指标;
[0051]
当网络性能指标为聚集系数时,i=3,攻击方的原有收益值表示为:
[0052][0053]
其中,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之前的聚集系数,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之后的聚集系数,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,聚集系数网络性能指标对应的攻击方在不同纯策略局势下的直觉模糊集收益矩阵表示为:
[0054][0055]
其中,μ
3amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,聚集系数收益值的隶属度,ν
3amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,聚集系数收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标3表示以聚集系数为网络性能指标;
[0056]
设aj=《μj,νj》(j=1,2,
…
,n)为一组直觉模糊集,n表示指标数量,直觉模糊加权集结算子定义为:
[0057][0058]
式中,ω=(ω1,ω2,
…
,ωn)为aj(j=1,2,
…
,n)的权重向量,满足条件0≤ωj≤1,用直觉模糊加权集结算子ifwa
ω
将m1,m2,m3加权集结为综合的直觉模糊集支付矩阵,即
[0059][0060]
其中,μ
amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时综合收益值的隶属度,ν
amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时综合收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略。
[0061]
具体地,对于综合的直觉模糊集支付矩阵,步骤5中所述的非线性规划问题为:
[0062][0063]
和
[0064][0065]
其中,i表示攻击方的第i个攻击策略,共m个攻击策略;j表示防御方的第j个防御策略,共n个防御策略;μ
ij
表示攻击方选择第i个攻击策略,防御方选择第j个防御策略时,攻击方直觉模糊集收益矩阵中的隶属函数值,ν
ij
表示攻击方选择第i个攻击策略,防御方选择
第j个防御策略时,攻击方直觉模糊集收益矩阵中的非隶属函数值;λ表示隶属/非隶属函数约束的相对权重,λ确定后,得到的纳什均衡解为:(p,q,《μ,ν》,《σ,ρ》);p=(p1,p2,...,pm)
t
表示攻击方混合策略的概率向量,q=(q1,q2,...,qm)
t
表示防御方混合策略的概率向量;《μ,ν》表示博弈问题中攻击方的收益值,《σ,ρ》表示博弈问题中防御方的收益值,形式均为直觉模糊集。
[0066]
与现有方法相比,本发明方法的优点在于:网络攻防博弈是近年来的研究热点,然而现有的研究无法反映决策者对博弈问题认识的模糊性和综合性,本发明方法引入直觉模糊集收益矩阵,在博弈过程中,能更好地体现玩家的主观感受和经验,使得收益矩阵更符合实际情况,提高了博弈结果的准确性和可信度。此外,将多指标按权重融合形成新的收益矩阵,可以更好地考虑因素之间的关系和权重,减少不确定性对博弈结果的影响,最后得到攻防双方在模糊情况下应该做出的合理策略选择,并对结果进行分析。用直觉模糊理论解释网络攻防博弈的不确定性可以极大地拓宽网络攻防博弈研究在实际中的应用。
附图说明
[0067]
图1示出了本发明实施例的流程示意图;
[0068]
图2示出了本发明实施例中基础设施网络的示意图;
[0069]
图3示出了攻击方的混合策略纳什均衡结果图;
[0070]
图4示出了防御方的混合策略纳什均衡结果图。
具体实施方式
[0071]
为了使本发明的目的、技术方案和优点更加清楚,下面将结合附图对本发明作进一步地详细描述,显然,所描述的实施例仅仅是本发明一部份实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其它实施例,都属于本发明保护的范围。
[0072]
应当理解,此处所描述的具体实施例仅仅用以解释本发明,并不用于限定本发明。
[0073]
本实施例中只考虑一个攻击方和一个防御方,且双方均完全了解现有网络的拓扑结构信息。一个关键基础设施,如铁路网络,可抽象为简单无向图g(v,e),其中v={v1,v2,...,vn}代表网络中所有节点的集合,即铁路网络中的车站,其中n=|v|表示网络中的节点数量。是网络中所有边的集合,即铁路网络中的铁路线。
[0074]
只考虑一个攻击方和一个防御方,且双方均完全了解现有网络的拓扑结构信息。所有攻击和防御的对象均为网络中的节点。节点被成功攻下的判断准则为:节点被攻击方攻击而没有被防御方保护。二人零和博弈,节点越重要攻击或防御所需要的成本越高。
[0075]
如图1所示,基于多指标融合的基础设施网络攻防博弈策略生成方法,所述方法包括:
[0076]
步骤1,获取基础设施网络的拓扑结构,攻击方和防御方分别为局中人1和局中人2,确定局中人1和局中人2的策略集合,构建基础设施网络博弈模型;
[0077]
步骤2,分别以最大连通片规模、网络效率和聚集系数三个网络性能指标,计算基础设施网络博弈中局中人1和局中人2在各种策略剖面下的收益矩阵;
[0078]
步骤3,根据决策者的偏好,构建最大连通片规模、网络效率和聚集系数三个网络
性能指标对应的三对隶属度函数和非隶属度函数;
[0079]
步骤4,利用三对隶属度函数和非隶属度函数,将步骤2中所述的收益矩阵转换为直觉模糊集收益矩阵,并用直觉模糊加权集结算子加权融合,得到最终收益矩阵;
[0080]
步骤5,结合直觉模糊集理论,将基础设施网络博弈模型的求解转换为非线性规划问题的求解,得到局中人1和局中人2的混合策略纳什均衡解;
[0081]
所述的基础设施网络表示为简单无向图g(v,e),其中v={v1,v2,...,vn}代表基础设施网络中所有节点的集合,其中,n=|v|表示基础设施网络中的节点数量,是基础设施网络中所有边的集合。
[0082]
具体地,所述的攻击方的攻击策略集合为sa,对于一个攻击策略向量sa=[x1,x2,...,xn]∈sa,xi表示第i个基础设施是否被攻击,记为攻击节点的集合,如果第i个节点vi被攻击,即vi∈va,xi=1,否则xi=0;所述的防御方的防御策略集合为sd,防御方的一个防御策略向量sd=[y1,y2,...,yn]∈sd,yi表示第i个基础设施是否被防御,记为防御节点的集合,如果第i个节点vi被防御,即vi∈vd,yi=1,否则yi=0,对于被攻击的节点vi,若同时存在xi=1且yi=0,即虽被攻击但是未被保护,则节点vi将被移除;
[0083]
对于第i个节点vi,记与分别为攻击方的攻击成本与防御方的防御成本,节点vi的攻击成本与防御成本分别表示为:
[0084][0085]
其中,ri表示节点vi的结构属性指标,qa表示攻击方的成本敏感系数,即节点的结构属性指标对攻击方的攻击成本的影响情况,qd表示防御方的成本敏感系数,即节点的结构属性指标对防御方的防御成本的影响情况;
[0086]
定义攻防双方的可用资源分别为:
[0087][0088][0089]
其中,ca表示攻击方的可用资源,cd表示防御方的可用资源;θa∈[0,1],θd∈[0,1]分别为攻击预算约束系数和防御预算约束系数;
[0090]
设攻击方的总攻击成本为c
x
,则:
[0091][0092]
攻击方总攻击成本是有限的,因此应满足约束:
[0093][0094]
防御方的总防御成本为cy,则:
[0095][0096]
所述的策略集合包括攻击方的攻击策略集合和防御方的防御策略集合,攻击方的
攻击策略集合包括三种典型策略,即最大度攻击策略s
amax
∈sa、最小度攻击策略s
amin
∈sa、随机攻击策略s
arand
∈sa,最大度攻击策略按照节点度数从高到低的顺序进行攻击,最小度攻击策略按照节点度数从低到高的顺序进行攻击,随机攻击策略随机选择满足成本约束条件的节点进行攻击;防御方的防御策略集合包括三种典型策略,即最大度防御策略s
dmax
∈sd、最小度防御策略s
dmax
∈sd、随机防御策略s
drand
∈sd,最大度防御策略按照节点度数从高到低的顺序进行防御,最小度防御策略按照节点度数从低到高的顺序进行防御,随机防御策略随机选择满足成本约束条件的节点进行防御。
[0097]
进一步地,所述的结构属性指标为度、介数或者特征向量中心性。
[0098]
具体地,所述的收益矩阵包括攻击方的收益矩阵和防御方的收益矩阵,为攻击方在网络性能指标i下的收益函数,则表示攻击方在网络性能指标i下选择攻击策略x和防御方选择防御策略y时攻击方的收益,表示网络性能指标i下攻击方在选择攻击策略x和防御方选择防御策略y时防御方的收益,记i=1表示网络性能指标为最大连通片规模,i=2表示网络性能指标为网络效率,i=3表示网络性能指标为聚集系数,则有:
[0099][0100][0101][0102][0103][0104][0105]
其中,γ(g),e(g)和h(g)分别表示初始的基础设施网络的最大连通片规模,网络效率和聚集系数,记所有被移除的节点组成的集合为节点被移除后组成的网络为是节点被移除后组成的基础设施网络中所有边的集合,和表示进行一轮博弈后基础设施网络的最大连通片规模,网络效率和聚集系数,且满足和聚集系数,且满足
[0106]
更进一步地,网络性能指标i对应下的隶属度函数和非隶属度函数的采取双曲线隶属度函数μi(x)和非隶属度函数νi(x)的形式:
[0107][0108][0109]
其中,α表示最高可接受水平,β表示最低可接受水平;
[0110]
攻击方选取攻击策略集合sa中的一个攻击策略s
amax
,s
amin
,s
arand
∈sa,防御方选取防御策略集合sd中的一个防御策略s
dmax
,s
dmin
,s
drand
∈sd,当网络性能指标为最大连通片规模时,i=1,攻击方的原有收益值表示为:
[0111][0112]
其中,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之前的最大联通片规模,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之后的最大联通片规模,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,最大连通片规模网络性能指标对应的攻击方在不同策略局势下的直觉模糊集收益矩阵表示为:
[0113][0114]
其中,μ
1amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时最大联通片规模的收益值隶属度,ν
1amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时最大联通片规模的收益值非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标1表示以最大联通片规模为网络性能指标;
[0115]
当网络性能指标为网络效率时,i=2,攻击方的原有收益值表示为:
[0116][0117]
其中,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之前的网络效率,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之后的
网络效率,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,网络效率网络性能指标对应的攻击方在不同纯策略局势下的直觉模糊集收益矩阵表示为:
[0118][0119]
其中,μ
2amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,网络效率收益值的隶属度,ν
2amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,网络效率收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标2表示以网络效率为网络性能指标;
[0120]
当网络性能指标为聚集系数时,i=3,攻击方的原有收益值表示为:
[0121][0122]
其中,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之前的聚集系数,表示攻击方攻击策略为sa,防御方防御策略为sd时在进行博弈之后的聚集系数,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,聚集系数网络性能指标对应的攻击方在不同纯策略局势下的直觉模糊集收益矩阵表示为:
[0123][0124]
其中,μ
3amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,聚集系数收益值的隶属度,ν
3amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,聚集系数收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标3表示以聚集系数为网络性能指标;
[0125]
设aj=《μj,νj》(j=1,2,
…
,n)为一组直觉模糊集,n表示指标数量,直觉模糊加权集结算子定义为:
[0126][0127]
式中,ω=(ω1,ω2,
…
,ωn)为aj(j=1,2,
…
,n)的权重向量,满足条件0≤ωj≤1,用直觉模糊加权集结算子ifwa
ω
将m1,m2,m3加权集结为综合的直觉模糊集支付矩阵,即
[0128][0129]
其中,μ
amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时综合收益值的隶属度,ν
amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时综合收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略。
[0130]
具体地,对于综合的直觉模糊集支付矩阵,步骤5中所述的非线性规划问题为:
[0131][0132]
和
[0133][0134]
其中,i表示攻击方的第i个攻击策略,共m个攻击策略;j表示防御方的第j个防御策略,共n个防御策略;μ
ij
表示攻击方选择第i个攻击策略,防御方选择第j个防御策略时,攻击方直觉模糊集收益矩阵中的隶属函数值,ν
ij
表示攻击方选择第i个攻击策略,防御方选择
第j个防御策略时,攻击方直觉模糊集收益矩阵中的非隶属函数值;λ表示隶属/非隶属函数约束的相对权重,λ确定后,得到的纳什均衡解为:(p,q,《μ,ν》,《σ,ρ》);p=(p1,p2,...,pm)
t
表示攻击方混合策略的概率向量,q=(q1,q2,...,qm)
t
表示防御方混合策略的概率向量;《μ,ν》表示博弈问题中攻击方的收益值,《σ,ρ》表示博弈问题中防御方的收益值,形式均为直觉模糊集。
[0135]
现实生活中基础设施网络结构多种多样,本实施例中实验以一个300个节点的无标度网络结构为例,如图2所示,并假设双方资源有限;
[0136]
在本实施例中,考虑三个网络指标(n=3),分别是最大连通片规模、网络效率、聚集系数;权重ω=(ω1,ω2,
…
,ωn)取决于决策者自身偏好,在本实施例中,ω1=0.2,ω2=0.2,ω3=0.6;
[0137]
设攻击方的攻击成本为ca,防御方的防御成本为cd,对于攻击方,应满足约束:
[0138][0139]
防御方应满足约束:
[0140][0141]
在本实施例中,θa与θd为[0.1,0.9]中的实数,以步长为0.1进行遍历;
[0142]
进而,将各个指标转换为直觉模糊集,最大连通片规模指标的隶属度函数如下,其中α=0.35,β=0.2:
[0143][0144]
非隶属度函数如下,其中α=0.8,β=0.2:
[0145][0146]
网络效率指标的隶属度函数如下,其中m=0.5,n=0.3:
[0147][0148]
非隶属度函数如下,其中m=0.5,n=0.05:
[0149]
[0150]
聚集系数指标的隶属度函数与非隶属度函数如下,其中t1=0.3,t2=0.6
[0151][0152]
非隶属度函数如下,其中t1=-0.05,t2=0.5
[0153][0154]
接着,将以上三个指标进行融合,直觉模糊加权集结算子可定义为:
[0155][0156]
式中,ω=(ω1,ω2,
…
,ωn)为aj(j=1,2,
…
,n)的权重向量,满足条件0≤ωj≤1,在本实施例中,ω1=0.2,ω2=0.2,ω3=0.6,进而得到综合指标的收益矩阵,根据本专利的方法,最终得到博弈双方的优化策略。
[0157]
以最大度策略为例,得到攻击方的混合策略纳什均衡结果如图3所示,可以看出随着θa和θd的变化,攻击方选择最大度策略的概率存在起伏,其中,当θa为0.9,θd为0.1时,选择最大度策略的概率为0.96;
[0158]
防御方的混合策略纳什均衡结果如图4所示,可以看出随着θa变大,θd变小,选择最大度策略的概率呈下降趋势,其中,当θa为0.9,θd为0.1时,选择最大度策略的概率为0.02。
[0159]
本领域技术人员应明白,本技术的实施例可提供为方法、系统或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例或结合软件和硬件方面的实施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
技术特征:
1.基于多指标融合的基础设施网络攻防博弈策略生成方法,其特征在于,所述方法包括:步骤1,获取基础设施网络的拓扑结构,攻击方和防御方分别为局中人1和局中人2,确定局中人1和局中人2的策略集合,构建基础设施网络博弈模型;步骤2,分别以最大连通片规模、网络效率和聚集系数三个网络性能指标,计算基础设施网络博弈中局中人1和局中人2在各种策略剖面下的收益矩阵;步骤3,根据决策者的偏好,构建最大连通片规模、网络效率和聚集系数三个网络性能指标对应的三对隶属度函数和非隶属度函数;步骤4,利用三对隶属度函数和非隶属度函数,将步骤2中所述的收益矩阵转换为直觉模糊集收益矩阵,并用直觉模糊加权集结算子加权融合,得到最终收益矩阵;步骤5,结合直觉模糊集理论,将基础设施网络博弈模型的求解转换为非线性规划问题的求解,得到局中人1和局中人2的混合策略纳什均衡解;所述的基础设施网络表示为简单无向图g(v,e),其中v={v1,v2,...,v
n
}代表基础设施网络中所有节点的集合,其中,n=|v|表示基础设施网络中的节点数量,是基础设施网络中所有边的集合。2.根据权利要求1所述的基于多指标融合的基础设施网络攻防博弈策略生成方法,其特征在于,所述的攻击方的攻击策略集合为s
a
,对于一个攻击策略向量s
a
=[x1,x2,...,x
n
]∈s
a
,x
i
表示第i个基础设施是否被攻击,记为攻击节点的集合,如果第i个节点v
i
被攻击,即v
i
∈v
a
,x
i
=1,否则x
i
=0;所述的防御方的防御策略集合为s
d
,防御方的一个防御策略向量s
d
=[y1,y2,...,y
n
]∈s
d
,y
i
表示第i个基础设施是否被防御,记为防御节点的集合,如果第i个节点v
i
被防御,即v
i
∈v
d
,y
i
=1,否则y
i
=0,对于被攻击的节点v
i
,若同时存在x
i
=1且y
i
=0,即虽被攻击但是未被保护,则节点v
i
将被移除;对于第i个节点v
i
,记与分别为攻击方的攻击成本与防御方的防御成本,节点v
i
的攻击成本与防御成本分别表示为:其中,r
i
表示节点v
i
的结构属性指标,q
a
表示攻击方的成本敏感系数,即节点的结构属性指标对攻击方的攻击成本的影响情况,q
d
表示防御方的成本敏感系数,即节点的结构属性指标对防御方的防御成本的影响情况;定义攻防双方的可用资源分别为:定义攻防双方的可用资源分别为:其中,c
a
表示攻击方的可用资源,c
d
表示防御方的可用资源;θ
a
∈[0,1],θ
d
∈[0,1]分别为攻击预算约束系数和防御预算约束系数;设攻击方的总攻击成本为c
x
,则:
攻击方总攻击成本是有限的,因此应满足约束:防御方的总防御成本为c
y
,则:所述的策略集合包括攻击方的攻击策略集合和防御方的防御策略集合,攻击方的攻击策略集合包括三种典型策略,即最大度攻击策略s
amax
∈s
a
、最小度攻击策略s
amin
∈s
a
、随机攻击策略s
arand
∈s
a
,最大度攻击策略按照节点度数从高到低的顺序进行攻击,最小度攻击策略按照节点度数从低到高的顺序进行攻击,随机攻击策略随机选择满足成本约束条件的节点进行攻击;防御方的防御策略集合包括三种典型策略,即最大度防御策略s
dmax
∈s
d
、最小度防御策略s
dmax
∈s
d
、随机防御策略s
drand
∈s
d
,最大度防御策略按照节点度数从高到低的顺序进行防御,最小度防御策略按照节点度数从低到高的顺序进行防御,随机防御策略随机选择满足成本约束条件的节点进行防御。3.根据权利要求2所述的基于多指标融合的基础设施网络攻防博弈策略生成方法,其特征在于,所述的结构属性指标为度、介数或者特征向量中心性。4.根据权利要求2所述的基于多指标融合的基础设施网络攻防博弈策略生成方法,其特征在于,所述的收益矩阵包括攻击方的收益矩阵和防御方的收益矩阵,u
ia
:|s
a
|
×
|s
d
|为攻击方在网络性能指标i下的收益函数,则u
ia
(x,y)表示攻击方在网络性能指标i下选择攻击策略x和防御方选择防御策略y时攻击方的收益,u
id
(x,y)表示网络性能指标i下攻击方在选择攻击策略x和防御方选择防御策略y时防御方的收益,记i=1表示网络性能指标为最大连通片规模,i=2表示网络性能指标为网络效率,i=3表示网络性能指标为聚集系数,则有:有:有:有:有:有:
其中,γ(g),e(g)和h(g)分别表示初始的基础设施网络的最大连通片规模,网络效率和聚集系数,记所有被移除的节点组成的集合为节点被移除后组成的网络为是节点被移除后组成的基础设施网络中所有边的集合,和表示进行一轮博弈后基础设施网络的最大连通片规模,网络效率和聚集系数,且满足和聚集系数,且满足5.根据权利要求4所述的基于多指标融合的基础设施网络攻防博弈策略生成方法,其特征在于,网络性能指标i对应下的隶属度函数和非隶属度函数的采取双曲线隶属度函数μ
i
(x)和非隶属度函数ν
i
(x)的形式:(x)的形式:其中,α表示最高可接受水平,β表示最低可接受水平;攻击方选取攻击策略集合s
a
中的一个攻击策略s
amax
,s
amin
,s
arand
∈s
a
,防御方选取防御策略集合s
d
中的一个防御策略s
dmax
,s
dmin
,s
drand
∈s
d
,当网络性能指标为最大连通片规模时,i=1,攻击方的原有收益值表示为:其中,γ(g)
sasd
表示攻击方攻击策略为s
a
,防御方防御策略为s
d
时在进行博弈之前的最大联通片规模,表示攻击方攻击策略为s
a
,防御方防御策略为s
d
时在进行博弈之后的最大联通片规模,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,最大连通片规模网络性能指标对应的攻击方在不同策略局势下的直觉模糊集收益矩阵表示为:其中,μ
1amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时最大联通片规模的收益值隶属度,ν
1amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时最大联通片规模的收益值非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度
攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标1表示以最大联通片规模为网络性能指标;当网络性能指标为网络效率时,i=2,攻击方的原有收益值表示为:其中,表示攻击方攻击策略为s
a
,防御方防御策略为s
d
时在进行博弈之前的网络效率,表示攻击方攻击策略为s
a
,防御方防御策略为s
d
时在进行博弈之后的网络效率,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,网络效率网络性能指标对应的攻击方在不同纯策略局势下的直觉模糊集收益矩阵表示为:其中,μ
2amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,网络效率收益值的隶属度,ν
2amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,网络效率收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标2表示以网络效率为网络性能指标;当网络性能指标为聚集系数时,i=3,攻击方的原有收益值表示为:其中,h(g)
sasd
表示攻击方攻击策略为s
a
,防御方防御策略为s
d
时在进行博弈之前的聚集系数,表示攻击方攻击策略为s
a
,防御方防御策略为s
d
时在进行博弈之后的聚集系数,通过双曲隶属函数将攻击方的原有收益值转化为直觉模糊集而防御方的损失也为由此,聚集系数网络性能指标对应的攻击方在不同纯策略局势下的直觉模糊集收益矩阵表示为:
其中,μ
3amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,聚集系数收益值的隶属度,ν
3amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时,聚集系数收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略,下标3表示以聚集系数为网络性能指标;设a
j
=<μ
j
,ν
j
>(j=1,2,
…
,n)为一组直觉模糊集,n表示指标数量,直觉模糊加权集结算子定义为:式中,ω=(ω1,ω2,
…
,ω
n
)为a
j
(j=1,2,
…
,n)的权重向量,满足条件0≤ω
j
≤1,用直觉模糊加权集结算子ifwa
ω
将m1,m2,m3加权集结为综合的直觉模糊集支付矩阵,即其中,μ
amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时综合收益值的隶属度,ν
amaxdmax
表示攻击策略为最大度攻击策略s
amax
,防御策略为最大度防御策略s
dmax
时综合收益值的非隶属度,其他符号中的μ表示隶属度,符号中的ν表示非隶属度,下标amax,amin,arand表示攻击方的最大度攻击策略、最小度攻击策略、随机攻击策略,下标dmax,dmin,drand表示防御方的最大度防御策略、最小度防御策略、随机防御策略。6.根据权利要求5所述的基于多指标融合的基础设施网络攻防博弈策略生成方法,其特征在于,对于综合的直觉模糊集支付矩阵,步骤5中所述的非线性规划问题为:min{(1-μ)
λ
ν
1-λ
}和min{(1-σ)
λ
ρ
1-λ
}
其中,i表示攻击方的第i个攻击策略,共m个攻击策略;j表示防御方的第j个防御策略,共n个防御策略;μ
ij
表示攻击方选择第i个攻击策略,防御方选择第j个防御策略时,攻击方直觉模糊集收益矩阵中的隶属函数值,ν
ij
表示攻击方选择第i个攻击策略,防御方选择第j个防御策略时,攻击方直觉模糊集收益矩阵中的非隶属函数值;λ表示隶属/非隶属函数约束的相对权重,λ确定后,得到的纳什均衡解为:(p,q,<μ,ν>,<σ,ρ>);p=(p1,p2,...,p
m
)
t
表示攻击方混合策略的概率向量,q=(q1,q2,...,q
m
)
t
表示防御方混合策略的概率向量;<μ,ν>表示博弈问题中攻击方的收益值,<σ,ρ>表示博弈问题中防御方的收益值,形式均为直觉模糊集。
技术总结
本发明公开了基于多指标融合的基础设施网络攻防博弈策略生成方法,其特征在于,所述方法包括:获取基础设施网络的拓扑结构,确定局中人1和局中人2的策略集合,构建基础设施网络博弈模型;分别以最大连通片规模、网络效率和聚集系数三个网络性能指标,计算基础设施网络博弈中局中人1和局中人2在各种策略剖面下的收益矩阵;根据决策者的偏好,构建三对隶属度函数和非隶属度函数;利用三对隶属度函数和非隶属度函数,将所述收益矩阵转换为直觉模糊集收益矩阵,并用直觉模糊加权集结算子加权融合,得到最终收益矩阵;结合直觉模糊集理论,将基础设施网络博弈模型的求解转换为非线性规划问题的求解,得到局中人1和局中人2的混合策略纳什均衡解。略纳什均衡解。略纳什均衡解。
技术研发人员:董艺博 李卫丽 任加祺 刘进 李哲 尹晓晴 马屹钦 喻婧
受保护的技术使用者:中国人民解放军国防科技大学
技术研发日:2023.06.14
技术公布日:2023/10/5
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/