基于差分隐私保护的指纹图像局部保护发布方法及设备
未命名
09-24
阅读:165
评论:0
1.本发明涉及生物信息安全技术领域。
背景技术:
2.现代信息技术不断发展,指纹识别技术在生活中的各种领域和各种产品中都被广泛的使用。指纹识别在生物识别中具有重要的地位,生物识别技术通过对人体生物特征进行分析认证,从而达到身份的识别功能。
3.差分隐私保护技术是一种无论攻击者拥有多大的背景知识都可以对隐私内容达到保护效果的一种技术。同时在差分隐私的定义中含有参数变量ε,通过控制ε的大小可以对隐私保护的程度进行调整。这样可以对指纹图像的隐私性与可用性进行合理的规划和调整,防止由于过度隐私性而导致图像的可用性受到严重的破坏。在指纹图像中添加的噪声量是根据敏感信息的多少进行调整,跟数据集中的整体数据无关,这样可以防止大量的噪声破坏数据集中的有用数据,从而达到最高的隐私保护效果。当前指纹图像的采集与识别主要使用的是二维的灰度图像,灰度图像可以作为实数域矩阵进行表示。图像中的像素点与矩阵中的数值一一对应,对二维灰度图像的处理实际就是对二维数据矩阵的处理。使用差分隐私对图像进行保护时,实际就是对二维矩阵中的数据进行扰动,从而实现对二维灰度图像的保护效果。
4.指纹图像的匹配是指纹识别中最后一个步骤,通常指纹匹配算法通过指纹的排列找到两个指纹之间的对应点。指纹的排列指的是通过图像平移、旋转以及尺度变换使两幅图像具有最相似的形态,然后通过匹配准则对两幅图像的特征点集进行计算得到指纹之间的对应点。根据目前的指纹识别研究,有许多种指纹的匹配方法,本发明主要针对目前使用最广泛,快捷的基于点模式的匹配方法的细节点描述算子进行指纹图像的保护过程。
5.现有方案中,缺少对隐私预算分配方法的设计,同时,在相同的隐私预算条件下,laplace机制的误差主要根据全局敏感度的大小进行计算。因此通过对图像数据的分割,改变差分隐私中的全局敏感度大小,从而改变laplace机制产生的噪声误差,由于全局敏感度过大,会导致laplace机制产生过大的噪声误差。上述原因均会导致指纹图像隐私保护不全面。
6.因此,如何提供一种保护效果更好更全面的指纹图像局部保护发布方法,成为本领域亟待解决的技术问题。
技术实现要素:
7.为了解决上述技术问题,本发明提供了一种基于差分隐私保护的指纹图像局部保护发布方法及设备,该方法依据指纹图像的匹配过程,对指纹图像进行分割提取包含特征点的敏感区域,并对敏感区域使用差分隐私技术进行保护,通过局部保护的方式实现指纹图像的全局保护效果。
8.基于同一发明构思,本发明具有三个独立的技术方案:
9.1、一种基于差分隐私保护的指纹图像局部保护发布方法,包括:
10.对指纹图像进行预处理;
11.提取所述指纹图像的特征点;
12.使用agnes聚类算法对所述特征点进行分簇,得到k个包含所述特征点的规则子区域;
13.对k个所述规则子区域内的特征点进行多项式回归,得到k个不规则子区域;
14.根据所述不规则子区域中的特征点个数以及子区域大小,定义敏感信息保护程度;
15.对各个所述不规则子区域计算敏感信息保护程度并分配隐私预算,根据所述隐私预算和计算得到的局部敏感度对各个所述不规则子区域添加扰动噪声;
16.将经过保护的所述指纹图像进行发布。
17.进一步地,所述规则子区域为矩形区域,所述规则子区域的边界根据分簇得到的簇内最边缘的特征点坐标和调整幅度得到,所述调整幅度为所述规则子区域内特征点之间的最小距离。
18.进一步地,对k个所述规则子区域内的特征点进行多项式回归,得到k个不规则子区域,包括:
19.以所述规则子区域内特征点之间的最小欧式距离为最优残差;
20.根据所述规则子区域内特征点构建多项式回归模型,得到样本最大残差与所述最优残差最接近的多项式回归模型;
21.基于所述多项式回归模型计算实际最大残差与最小残差,将所述实际最大残差与最小残差之和作为波动幅度;
22.根据所述波动幅度确定多项式回归模型为轴的波动区域,得到不规则子区域。
23.进一步地,所述敏感信息保护程度通过如下公式表示:
24.ii=mi/qi;
25.其中,qi表示第i个不规则子区域的大小,mi表示第i个不规则子区域内包含的特征点个数。
26.进一步地,对各个所述不规则子区域计算敏感信息保护程度并分配隐私预算,根据所述隐私预算和计算得到的局部敏感度对所述不规则子区域添加扰动噪声,具体包括如下步骤:
27.计算未添加保护的不规则子区域的敏感信息保护程度,将所述敏感信息保护程度输入打分函数,根据所述打分函数输出的各不规则区域概率,选择概率最高的不规则子区域作为当前区域;
28.根据所述当前区域大小与所述未添加保护的不规则子区域大小的关系,分配隐私预算;
29.根据所述隐私预算和局部敏感度对所述当前区域添加扰动噪声,所述扰动噪声为符合laplace分布的随机噪声;
30.重复上述步骤,直至全部所述不规则子区域添加扰动噪声。
31.进一步地,所述打分函数表示如下:
32.33.其中,pi为指数机制打分函数输出的各不规则区域概率,δq(x,ii)表示根据单个保护像素对细节点特征的保护程度ii设计的打分函数,ii为敏感信息保护程度,δu表示打分函数δq(x,ii)的敏感度,m表示从指纹图像中提取的特征点个数,ε1表示差分隐私指数机制消耗的隐私预算量,i表示k个待保护区域的保护程度集合。
34.进一步地,所述局部敏感度通过如下公式表示:
35.δq
gs
=max(δq
ls
);
36.δq
ls
=max
x,x'
||q(x)-q(x
′
)||
ρ
;
37.其中,q为查询函数,δq
ls
表示各不规则子区域的敏感度,δq
gs
表示局部敏感度,q(x)表示输入集合为x时的输出集合,q(x')表示输入集合为x'时的输出集合,x与x'表示相差一个数据的邻近数据集,x表示数据集x中的数据,x'表示数据集x'中的数据,ρ表示距离计算系数。
38.进一步地,对所述不规则子区域添加扰动噪声时,根据差分隐私laplace机制添加扰动噪声,所述laplace机制分布的概率密度函数表示如下:
[0039][0040][0041]
其中,x为被扰动的噪声数据,b为噪声的分布尺度,ε为隐私预算的大小,δq为敏感度大小,根据所述指纹图像的像素值为0-255,噪声的分布尺度b小于像素数据的最大波动幅度,即b≤256。
[0042]
2、一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0043]
3、一种电子设备,包括处理器和存储装置,所述存储装置中存有多条指令,所述处理器用于读取所述存储装置中的多条指令并执行上述的方法。
[0044]
本发明提供的基于差分隐私保护的指纹图像局部保护发布方法及设备,至少包括如下有益效果:
[0045]
(1)在指纹图像发布的过程中根据指纹图像的匹配过程,对敏感信息进行一定的保护,使得指纹图像在发布过程中既具有可用性,又具有隐私性,同时根据差分隐私的定义,可以根据对隐私预算进行调节,当隐私预算取值接近于零时,指纹图像具有最强的隐私性;当隐私预算取最大值时,指纹图像具有最强的可用性;
[0046]
(2)通过提取包含特征点信息的敏感区域进行保护,可以有效的对指纹图像进行保护同时相比较于全局图像的保护,敏感区域的保护具有更好的保护效果;
[0047]
(3)根据差分隐私的定义与laplace机制的扰动噪声规律,指纹图像添加扰动噪声的大小与局部敏感度的大小有关,与隐私预算的大小有关,对于符合差分隐私定义的保护方法,随着隐私预算的不断增加,添加的扰动噪声越小,图像的可用性越高,隐私性越低;随着隐私预算的不断减小,添加的噪声越大,图像的可用性越低,隐私性越高。
附图说明
[0048]
为了更清楚地说明本技术实施例中的技术方案,下面将对实施例或现有技术描述
中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0049]
图1为本发明提供的基于差分隐私保护的指纹图像局部保护发布方法的工作流程图;
[0050]
图2为图像预处理提取特征点分布图;
[0051]
图3为根据聚类算法对特征点分簇提取规则子区域直观图;
[0052]
图4为对各规则子区域使用多项式回归进一步分割得到不规则子区域的直观图;
[0053]
图5为不同隐私预算添加下指数机制对抽样过程的保护抽样概率折线图;
[0054]
图6为不同的隐私预算分配机制对与本发明隐私预算分配过程的对比图;
[0055]
图7为原始图像的像素值分布与保护发布图像的像素值分布的对比图;
[0056]
图8为不同隐私预算条件下的隐私保护发布指纹图像对比图;
[0057]
图9为在发明的不同阶段添加隐私保护后的指纹图像识别率对比。
具体实施方式
[0058]
为了更好的理解上述技术方案,下面将结合说明书附图以及具体的实施方式对上述技术方案做详细的说明。
[0059]
实施例一:
[0060]
在对指纹图像进行分割的过程中,根据指纹图像的特性,指纹图像中采集的细节点数量和位置并不确定,因此在根据细节点的数量和位置进行分割的过程中,指纹图像分割的局部图像数量同样并不固定,因此在对分割图像进行保护的过程中,需要对局部图像添加laplace噪声的顺序进行保护,并对隐私预算合理分配。
[0061]
参见图1,在一些实施例中,提供一种基于差分隐私保护的指纹图像局部保护发布方法,包括:
[0062]
s1、对指纹图像进行预处理;
[0063]
s2、提取所述指纹图像的特征点;
[0064]
s3、使用agnes聚类算法对所述特征点进行分簇,得到k个包含所述特征点的规则子区域;
[0065]
s4、对k个所述规则子区域内的特征点进行多项式回归,得到k个不规则子区域;
[0066]
s5、根据所述不规则子区域中的特征点个数以及子区域大小,定义敏感信息保护程度;
[0067]
s6、对各个所述不规则子区域计算敏感信息保护程度并分配隐私预算,根据所述隐私预算和计算得到的局部敏感度对各个所述不规则子区域添加扰动噪声;
[0068]
s7、将经过保护的所述指纹图像进行发布。
[0069]
参见图2,步骤s1中,指纹图像在匹配过程中根据脊线的端点与分叉点之间的相对位置进行匹配,在提取指纹图像特征点时需要对指纹图像的脊线进行预处理,主要包括图像增强和细化两个过程。根据不同的指纹图像采集器不同,采集到的指纹图像质量也不同,在对指纹图像提取特征之前需要先对指纹图像进行预处理操作,滤除图像噪声,根据姿态定位获取指纹图像的纹线图,方向图。对过滤后的指纹图像提取纹线骨架,达到细化指纹纹
线的目的,同时对得到的细化图进行处理,去除毛刺,空洞等干扰点。
[0070]
步骤s2中,指纹图像的特征可以分为三级特征:第一级是脊线方向场和频率图、第二级是脊线骨架图、第三级是脊线的内外轮廓。受限于指纹识别的使用广泛程度与指纹识别系统的造价与应用范围。一级特征主要应用于指纹库的检索工作。三级特征对指纹的识别匹配具有较高的精度,但同时对指纹的采样工作同样具有较高的要求,主要应用于一些安全保密程度较高的使用场景。本实施例中,指纹的匹配以二级特征,端点和分叉点为主要匹配,在指纹细化图像上提取端点与分叉点特征,根据人体生物特性,每个人的指纹具有差异性,因此指纹图像的特征点具有离散随机性。根据八像素提取法,以像素值不为空的像素点为中心,以大小为识别大小,根据周围八个像素的大小分布,判断该像素点是否为端点或交叉点。
[0071]
为保证指纹图像特征点信息的隐私性,最直接的方法就是对图像整体添加隐私保护,即对二维指纹图像矩阵中的每个元素都添加laplace扰动噪声,从而实现全局的隐私保护效果,依此输出的差分隐私保护图像的过程称为lap算法。
[0072]
lap算法流程:
[0073]
输入:原始指纹图像x
[0074]
输出:满足ε-差分隐私的全局隐私保护指纹图像x'
[0075]
参数:图像尺寸m
×
n、隐私预算ε
[0076]
1)读取原始图像x
[0077]
2)计算全局敏感度δq
lap
,δq
lap
=m
×n[0078]
3)添加laplace噪声:
[0079]
for p in range(m):
[0080]
for q in range(n):
[0081]
x'
(p,q)
=x
(p,q)
+lap(δq
lap
/ε)
[0082]
4)输出满足ε-差分隐私的全局隐私保护指纹图像x'。
[0083]
该过程是本实施例的一部分,输出的保护图像由于需要保护的像素量较大,因此根据差分隐私的定义,添加噪声扰动的laplace机制生成的扰动噪声同样很大。输出图像的可用性会随着隐私预算的增加变化幅度较慢,只有添加特别大的隐私预算才能使图像具有一定的可用性。
[0084]
步骤s3中,指纹匹配的过程是利用细节点之间的相对位置,并对细节点之间的距离进行度量,根据距离序列确定描述算子。在描述算子的计算过程中主要根据细节点之间的距离度量来决定,因此选择以自底向上的聚类算法agnes作为对特征点的分簇过程。根据特征点离散随机性使用agnes聚类算法对特征点进行分簇,用k表示分簇的个数,用mi表示各敏感区域包含的特征点个数。则满足根据agnes聚类算法将特征点进行分簇,应该得到k个包含特征点的敏感区域,即所述规则子区域。所述规则子区域为矩形区域,所述规则子区域的边界根据分簇得到的簇内最边缘的特征点坐标和调整幅度得到,所述调整幅度为所述规则子区域内特征点之间的最小距离。敏感区域边界以簇内最边缘的特征点坐标加以调整幅度为边界的矩形区域。添加调整幅度是为了防止特征点出现在边界上泄露敏感信息。
[0085]
边界计算为簇内最边缘特征点坐标加以调整幅度,具体表示如下:
[0086]
x轴坐标调整幅度计算为dist_x=min{dist(xm,xn),xm∈mi,xn∈mi},
[0087]
y轴坐标调整幅度计算为dist_y=min{dist(ym,yn),ym∈mi,yn∈mi},
[0088]
x轴坐标上边界计算为x
max
=max{mi[x,:]}+dist_x,
[0089]
x轴坐标下边界计算为x
min
=min{mi[x,:]}-dist_x,
[0090]
y轴坐标上边界计算为y
max
=max{mi[:,y]}+dist_y,
[0091]
y轴坐标下边界计算为y
min
=min{mi[:,y]}-dist_y。
[0092]
用qi表示敏感区域的大小,则qi=δx
×
δy=(x
max-x
min
+1)
×
(y
max-y
min
+1)。
[0093]
参见图3,展示的白色区域即为通过聚类算法分组后提取到的敏感区域,以敏感区域的的整体大小为全局敏感度的大小,对全体敏感区域通过差分隐私技术进行保护的过程称为klap算法。
[0094]
klap算法流程:
[0095]
输入:原始图像x、特征点坐标集合point(x,y)
[0096]
输出:满足差分隐私的非全局保护的图像x'
[0097]
参数:图像尺寸m
×
n、总隐私预算ε、细节点个数m、需要保护的像素q
[0098]
1)读取原始图像x,并转换为灰度图像矩阵xm×n[0099]
2)创建全零矩阵ym×n、读取特征点坐标集合point(x,y),并标记y(x,y)=255
[0100]
3)对特征点使用层次聚类算法agnes分簇,分簇结果为mi,
[0101]
4)根据分簇结果确定局部保护区域
[0102]
a.从分簇结果中选取mi,并标记
[0103]
b.根据簇中特征点坐标提取需要保护的像素量
[0104]
a)确定局部保护区域边界
[0105]
计算调整幅度:
[0106]
dist_x=min(dist(xm,xn),xm∈mi,xn∈mi}
[0107]
dist_y=min{dist(ym,yn),ym∈mi,yn∈mi}
[0108]
计算区域边界:
[0109]
x
max
=max{mi[x,:]}+dist_x
[0110]
x
min
=min{mi[x,:]}-dist_x
[0111]ymax
=max{mi[:,y]}+dist_y
[0112]ymin
=min{mi[:,y]}-dist_y
[0113]
b)标记需要保护的像素
[0114]
for x in range(x
max-x
min
+1):
[0115]
for y in range(y
max-y
min
+1):
[0116]
y(x+x
min
,y+y
min
)=255
[0117]
qi=qi+1
[0118]
c)跳转步骤a,重新选择mi,直至全部的mi被标记
[0119]
c.计算需要保护的总像素量q,
[0120]
for x in range(m):
[0121]
for y in range(n):
[0122]
if(y(x,y)==255):
[0123]
q=q+1
[0124]
5)根据需要保护的像素量计算全局敏感度δq,δq=q
[0125]
6)添加laplace噪声:
[0126]
for p in range(m):
[0127]
for q in range(n):
[0128]
if(y(p,q)==255):
[0129]
x'
(p,q)
=x
(p,q)
+lap(δq/ε)
[0130]
7)输出满足差分隐私的非全局保护的图像x'。
[0131]
与lap算法进行比较,由于敏感区域的提取使得全局敏感的的大小得到降低,根据差分隐私指数机制的概率密度函数分布,随着隐私预算的改变,添加的噪声量变换幅度增大,从而对于提高指纹图像的可用性具有明显的效果。
[0132]
但从图3中可以看出,经过聚类算法提取的敏感区域同样含有大量的伪敏感像素,即部分像素值的保护是不必要的。
[0133]
步骤s4中,对k个所述规则子区域内的特征点进行多项式回归,得到k个不规则子区域,包括:
[0134]
s41、以所述规则子区域内特征点之间的最小欧式距离为最优残差;
[0135]
s42、根据所述规则子区域内特征点构建多项式回归模型,得到样本最大残差与所述最优残差最接近的多项式回归模型;
[0136]
s43、基于所述多项式回归模型计算实际最大残差与最小残差,将所述最大残差与最小残差之和作为波动幅度;
[0137]
s44、根据所述波动幅度确定多项式回归模型为轴的波动区域,得到不规则子区域。
[0138]
根据聚类算法确定的矩形区域同样包含大量无需保护的区域,因此采用多项式回归的方法对敏感区域进行进一步的提取。在敏感区域提取的过程中需要满足所有特征点均被包含于敏感区域,同时考虑对特征点的位置信息,数量信息,类型信息的保护,每个敏感区域中必须包含多个特征点。采用多项式回归对敏感区域进行分割,可以保证全部的特征点均被包含在分割的敏感区域中,同时连续的图像可以同时覆盖步骤4的敏感区域内全部特征点均被覆盖。用q'i表示敏感区域的大小,则q'i《qi。
[0139]
根据多项式回归进一步确定敏感区域大小。以敏感区域内特征点之间的最小欧式距离为最优残差loss,计算为loss=min dist(xm,xn)。通过敏感区域内特征点构建多项式回归模型,最终得到一条样本最大残差与最优残差最接近的多项式回归模型h(x)。并计算实际最大残差与最小残差,最大残差计算为dist_max=max||h(x)-x||1,最小残差计算为dist_min=min||h(x)-x||1。为防止特征点出现在敏感区域边缘,泄露敏感信息,以最大残差dist_max与最小残差dist_min之和为多项式回归模型h(x)波动幅度dist,计算为dist=dist_max+dist_min。以多项式回归模型h(x)为轴的波动区域为敏感区域,q
′i表示敏感区域的大小,则q
′i<qi。
[0140]
图4中展示的白色区域即为通过聚类算法分组后提取到的敏感区域,以敏感区域的的整体大小为全局敏感度的大小,对敏感区域通过差分隐私技术进行保护的过程称为
rklap算法。
[0141]
rklap算法流程:
[0142]
输入:原始图像x、细节点坐标集合point(x,y)
[0143]
输出:满足差分隐私的非全局保护的图像x
′
[0144]
参数:图像尺寸m
×
n、总隐私预算ε、细节点个数m、需要保护的像素q
[0145]
1)读取原始图像x,并转换为灰度图像矩阵xm×n[0146]
2)创建全零矩阵ym×n、读取细节点坐标集合point(x,y),并标记y(x,y)=255
[0147]
3)获取算法klap提取的敏感区域,以分簇结果mi进行标记
[0148]
4)根据多项式回归对敏感区域进一步分割
[0149]
a.从敏感区域中选取mi,并标记
[0150]
b.计算簇内最小样本距离为最优残差loss=min dist(xm,xn)
[0151]
c.根据最优残差判断预测多项式回归模型h
′
(x),找到实际回归模型h(x)
[0152]
d.计算实际回归模型h(x)中的数据量:
[0153]
a)最大残差dist_max=max||h(x)-x||1[0154]
b)最小残差dist_min=min||h(x)-x||1[0155]
c)波动幅度dist=dist_max+dist_min
[0156]
e.以dist为波动幅度,h(x)回归模型为中线,分割敏感区域
[0157]
f.标记敏感区域大小:
[0158]
a)在x
max
到x
min
上连续选取坐标值x
[0159]
b)确定波动幅度内的像素坐标值y,(h(x)-dist)≤y≤(h(x)+dist)
[0160]
c)标记像素点:
[0161]
if(y
min
≤y≤y
max
):
[0162]
y(x,y)=255
[0163]
qi=qi+1
[0164]
g.跳转步骤a,重新选择mi,直至全部的mi被标记
[0165]
5)计算需要保护的总像素量q,
[0166]
for x in range(m):
[0167]
for y in range(n):
[0168]
if(y(x,y)==255):
[0169]
q=q+1
[0170]
6)根据需要保护的像素量计算全局敏感度δq,δq=q
[0171]
7)添加laplace噪声:
[0172]
for p in range(m):
[0173]
for q in range(n):
[0174]
if(y(p,q)==255):
[0175]
x
′
(p,q)
=x
(p,q)
+lap(δq/ε)
[0176]
8)满足差分隐私的非全局保护的图像x
′
。
[0177]
经过聚类算法与多项式回归的提取分割,得到了最佳的敏感区域大小,对敏感区域直接添加laplace扰动噪声,可以有效的提高指纹图像在发布过程中的保护效果。
[0178]
但直接对于敏感区域添加相同的扰动噪声,会造成隐私预算的浪费消耗。根据指纹图像的是识别过程,在对特征点描述算子进行选择时,优先考虑特征点较为密集的区域,因此可以根据指纹图像的特征点分布合理的分配隐私预算的大小。
[0179]
步骤s5中,对敏感区域内特征点的保护程度进行定义,ρ为特征点的密集程度,当ii增大时,ρ会随之增大;当ii减小时,ρ会随之减小。根据指纹图像的细节点描述算子,特征点的匹配程度与邻近的特征点距离有关,因此考虑在对指纹图像进行保护的过程中,特征点的密集程度不同,在图像的匹配过程中的重要程度也不同。根据指数机制可以从待保护的敏感区域中提取到特征点密度最高的,最重要的敏感区域。
[0180]
所述敏感信息保护程度通过如下公式表示:
[0181]ii
=mi/qi;
[0182]
其中,qi表示第i个不规则子区域的大小,mi表示第i个不规则子区域内包含的特征点个数。
[0183]
步骤s6,对各个所述不规则子区域计算敏感信息保护程度并分配隐私预算,根据所述隐私预算和计算得到的局部敏感度对所述不规则子区域添加扰动噪声,具体包括如下步骤:
[0184]
s61、计算未添加保护的不规则子区域的敏感信息保护程度,将所述敏感信息保护程度输入打分函数,根据所述打分函数输出的各不规则区域概率,选择概率最高的不规则子区域作为当前区域;
[0185]
s62、根据所述当前区域大小与所述未添加保护的不规则子区域大小的关系,分配隐私预算;
[0186]
s63、根据所述隐私预算和局部敏感度对所述当前区域添加扰动噪声,所述扰动噪声为符合laplace分布的随机噪声;
[0187]
s64、重复步骤s61-s63,直至全部所述不规则子区域添加扰动噪声。
[0188]
步骤s61中,基于指数机制打分函数设计,打分函数的输出为样本抽样的依据,这里以敏感区域内特征点的保护程度ii为输入。δq(x,i)表示根据单个保护像素对细节点特征的保护程度ii设计的打分函数,δu表示打分函数δq(x,i)的敏感度,在对分割的局部图像抽样过程中,敏感度的大小为抽样集中包含的样本个数,即δu=k。根据指数机制的定义,输出抽样概率为pi,根据指数机制可以从待保护的敏感区域中提取到特征点密度最高的,最重要的敏感区域。
[0189]
打分函数为差分隐私指数机制的重要核心,指数机制是对样本抽样的过程中对抽样过程进行保护的一种方法,所述打分函数表示如下:
[0190][0191]
其中,pi为指数机制打分函数输出的各不规则区域概率,δq(x,ii)表示根据单个保护像素对细节点特征的保护程度ii设计的打分函数,ii为敏感信息保护程度,δu表示打分函数δq(x,ii)的敏感度,m表示从指纹图像中提取的特征点个数,ε1表示差分隐私指数机制消耗的隐私预算量,i表示k个待保护区域的保护程度集合。
[0192]
以预先定义的未保护不规则子区域内特征点的保护程度ii为打分函数的输入,根据输出的各不规则子区域概率,选择概率最高的敏感区域优先进行保护。输出计算为pi=pr[m(x,δq)=ii],pj=max(pi),获取当前待保护敏感区域标签pj→
qj。
[0193]
图5展示了差分隐私指数机制在进行抽样保护的过程中,随着隐私预算的改变,各敏感区域的抽样概率同样发生改变。随着隐私预算的不断增加保护程度输入较大的敏感区域的抽样概率不断增加;相反,隐私预算越小,敏感区域的抽样概率与输入的保护程度大小占比越接近。满足差分隐私指数机制的定义。
[0194]
步骤s62中,为提高在指纹图像发布过程中的可用性,对于特征点密度较高的隐私区域添加更多的隐私预算,以提高指纹图像的整体可用性。合理的隐私预算分配机制是提高指纹图像在发布过程中保护效果的重要环节,根据差分隐私的定义,添加的隐私预算越高图像的可用性越高,添加的隐私预算越低图像的隐私性越高,指纹图像在发布过程中的隐私性在整体隐私预算取得最小值时得到最大的隐私性,因此在隐私预算固定时需要尽可能地提高图像的可用性。
[0195]
基于步骤s61的计算结果,优先对特征点密度较高的隐私区域添加隐私预算,若当前指数机制抽取的敏感区域大小qj;当前待保护敏感区域的总大小为计算为计算为剩余隐私预算分配计算为计算为
[0196]
根据当前区域大小qj与未添加保护的不规则子区域总大小为关系,合理分配隐私预算。
[0197]
如果则
[0198]
如果则
[0199]
如果则
[0200]
计算与与
[0201]
设每次分配隐私预算的分配系数为ω,即:
[0202]
当时,
[0203]
当时,
[0204]
当时,
[0205]
隐私预算的分配通用公式为
[0206]
对步骤s61中选择的当前区域分配隐私预算,计算当前指数机制抽取的敏感区域大小qj,当前待保护敏感区域的总大小为剩余隐私预算分配根据敏感区域大小qj与敏感区域的总大小为的关系分配隐私预算,
[0207]
步骤s61中对敏感区域进行隐私预算分配的过程被称为合理的隐私预算分配机制dp,图6展示了在实际的应用中,将本实施例设计的隐私预算分配机制dp与传统的五分法、四分法、三分法、二分法、泰勒展开法、特殊级数法、p级数法(依次从左至右)进行对比的示
意图。
[0208]
通过对比,传统的分配机制在分配过程中会迅速的消耗隐私预算的大小,随着分配次数的增加,隐私预算的分配直线下降。相反,dp机制的分配与保护图像的数据量有关,可以根据每次抽样的数据量大小合理分配隐私预算的大小。因此,本实施例提供的隐私预算分配机制dp,在对指纹图像的隐私预算进行分配时,优于传统的隐私预算分配机制。
[0209]
步骤s63中,所述局部敏感度通过如下步骤计算:
[0210]
设q为查询函数,其中,q:x
→rn
(x∈x),表示从输入集合x中输入查询变量x,必然可以得到输出量。
[0211]
q的局部敏感度通过如下公式表示:
[0212]
δq
gs
=max(δq
ls
);
[0213]
δq
ls
=max
x,x'
||q(x)-q(x
′
)||
ρ
;
[0214]
其中,q为查询函数,δq
ls
表示各不规则子区域的敏感度,δq
gs
表示局部敏感度,q(x)表示输入集合为x时的输出集合,q(x')表示输入集合为x'时的输出集合,x与x'表示相差一个数据的邻近数据集,x表示数据集x中的数据,x'表示数据集x'中的数据,ρ表示距离计算系数。其中,δq
ls
={q1,q2,
…
,qk}。
[0215]
特别的,当ρ=2时,ρ表示欧氏距离。
[0216]
根据laplace机制的定义,根据局部敏感度与分配的隐私预算对数据的扰动噪声为符合laplace分布随机噪声。对所述不规则子区域添加扰动噪声时,根据差分隐私laplace机制添加扰动噪声,所述laplace机制分布的概率密度函数表示如下:
[0217][0218][0219]
其中,x为被扰动的噪声数据,b为噪声的分布尺度,ε为隐私预算的大小,δq为敏感度大小,根据指纹图像的像素值为0~255,噪声的分布尺度b应当小于像素数据的最大波动幅度,即b≤256。
[0220]
对经过聚类算法与多项式回归提取分割得到的敏感区域,使用隐私预算分配机制dp对敏感区域分配隐私预算,并根据局部敏感度的大小,通过差分隐私的laplace机制添加扰动噪声。该过程被称为dp-rklap算法,也即本实施例提供的完整方法。
[0221]
dp-rklap算法流程:
[0222]
输入:原始图像x、细节点坐标集合point(x,y)
[0223]
输出:满足差分隐私的非全局保护的图像x
′
[0224]
参数:图像尺寸m
×
n、总隐私预算ε=ε1+ε2、细节点个数m、需要保护的像素q
[0225]
1)读取原始图像x,并转换为灰度图像矩阵xm×n[0226]
2)创建全零矩阵ym×n、zm×n读取细节点坐标集合point(x,y),并标记y(x,y)=255
[0227]
3)根据rklap算法提取分割敏感区域,并以mi进行表示,在zm×n中标记
[0228]
4)对敏感区域分配隐私预算
[0229]
a.指数机制满足ε
1-差分隐私
[0230]
b.laplace机制满足ε
2-差分隐私
[0231]
c.根据dp机制对敏感区域分配隐私预算εi,
[0232]
5)根据分配的隐私预算添加laplace噪声
[0233]
a.计算局部敏感度大小,用δq
gs
表示,计算为:
[0234]
a)δq
gs
=max(δq
ls
)
[0235]
b)δq
ls
={q1,q2,...,qk}
[0236]
b.根据指数机制抽样结果按顺序选取敏感区域mi[0237]
c.获取当前局部图像的隐私预算mi→
εj[0238]
d.对标记像素z(x,y)添加laplace噪声
[0239]
for p in range(m):
[0240]
for q in range(n):
[0241]
if(z(p,q)==255):
[0242]
x
′
(p,q)
=x
(p,q)
+lap(δq
gsj
/εj)
[0243]
e.跳转步骤b,直至全部敏感区域添加保护
[0244]
6)满足差分隐私的局部保护的图像x
′
。
[0245]
图7展示了经过dp-rklap算法保护后的发布指纹图像(b)与原图的指纹图像(a)像素值对比。通过图像对比,经过保护后发布的指纹图像与原始图像在像素值的分布上具有相同的分布结果,因此可以判断,经过保护后发布的指纹图像具有较高的可用性。
[0246]
图8展示了在不同隐私预算(从左至右依次增大)条件下的隐私保护发布指纹图像的结果对比,通过观察图像中的噪声点数量差别,随着隐私预算的不断增加,保护后的指纹图像噪声量不断减少,意味着发布图像的可用性不断提高,相反,随着隐私预算的不断减少,保护后的指纹图像噪声量不断增加,意味着发布图像的可用性不断降低。通过分析,该发布算法的保护过程满足差分隐私的定义。
[0247]
以下通过对比实验数据进一步说明本实施例的有益效果:
[0248]
对本实施例的不同保护阶段输出保护图像进行对比,并取不同的隐私预算进行对比。图9展示了在不同的隐私预算条件下,不同保护阶段输出的保护图像与原始图像的在识别率上的对比分析。
[0249]
根据图像,对不同算法与不同隐私预算条件下的发布图像,进行特征点识别,上述实验结果,展示了隐私预算分别取ε1,ε2,ε3,ε4,ε5(依次由右至左依次增大),算法lap、klap、rklap、dp_rklap(依次由左至右)的发布图像与原始图像的细节点识别率。
[0250]
本实施例是一种基于差分隐私保护的指纹图像局部保护发布方法,该方法以保护指纹图像在发布过程中的隐私性为目的,同时使得发布的指纹图像仍然具有一定的可用性。以原始指纹图像为输入,可以根据用户需求自由调节的隐私预算参数为变量,输出经过差分隐私保护指纹图像,使得图像既具有隐私性又具有可用性。同时根据不同阶段的保护输出,将该方法的保护过程分为四个部分。第一部分为直接对指纹图像的二维图像矩阵所有元素添加laplace噪声,实现最简单的差分隐私保护,以此输出的保护图像称为lap算法;第二部分为对经过聚类算法提取的敏感区域所有元素直接添加laplace噪声,实现简单的局部差分隐私保护,以此输出的保护图像称为klap算法;第三部分为对经过多项式回归分割得到的敏感区域所有元素直接添加laplace噪声,实现指纹图像的局部差分隐私保护,以此输出的保护图像称为rklap算法;第四部分为根据保护程度的计算,经过指数机制的抽
样,通过设计的隐私预算分配机制对每个敏感区域分配合理的隐私预算大小,并以局部敏感度为敏感值,对敏感区域添加laplace噪声,实现合理的局部差分隐私保护,以此输出的保护图像称为dp-rklap算法,其中对各敏感区域分配隐私预算大小的过程称为隐私预算的分配机制dp。
[0251]
通过实验能够清晰的看出,在算法lap中由于大量数据失真,导致算法的发布图像识别率不稳定,因此隐私预算的改变对识别率的影响较小;在算法klap的发布图像中,随着隐私预算的增加,算法发布图像与原始图像的识别率同步增加,但整体的识别率仍然较小;在算法rklap的发布图像中,随着隐私预算的增加,算法发布图像与原始图像的识别率逐渐增加,并且整体识别率较高;在算法dp_rklap的发布图像中,随着隐私预算的增加,算法发布图像与原始图像的识别率逐渐增加,并且整体识别率更高。
[0252]
实施例二:
[0253]
在一些实施例中,提供一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述的方法。
[0254]
实施例三:
[0255]
在一些实施例中,提供一种电子设备,包括处理器和存储装置,所述存储装置中存有多条指令,所述处理器用于读取所述存储装置中的多条指令并执行上述的方法。
[0256]
尽管已描述了本发明的优选实施例,但本领域内的技术人员一旦得知了基本创造性概念,则可对这些实施例作出另外的变更和修改。所以,所附权利要求意欲解释为包括优选实施例以及落入本发明范围的所有变更和修改。显然,本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样,倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内,则本发明也意图包含这些改动和变型在内。
技术特征:
1.一种基于差分隐私保护的指纹图像局部保护发布方法,其特征在于,包括:对指纹图像进行预处理;提取所述指纹图像的特征点;使用agnes聚类算法对所述特征点进行分簇,得到k个包含所述特征点的规则子区域;对k个所述规则子区域内的特征点进行多项式回归,得到k个不规则子区域;根据所述不规则子区域中的特征点个数以及子区域大小,定义敏感信息保护程度;对各个所述不规则子区域计算敏感信息保护程度并分配隐私预算,根据所述隐私预算和计算得到的局部敏感度对各个所述不规则子区域添加扰动噪声;将经过保护的所述指纹图像进行发布。2.根据权利要求1所述的方法,其特征在于,所述规则子区域为矩形区域,所述规则子区域的边界根据分簇得到的簇内最边缘的特征点坐标和调整幅度得到,所述调整幅度为所述规则子区域内特征点之间的最小距离。3.根据权利要求1所述的方法,其特征在于,对k个所述规则子区域内的特征点进行多项式回归,得到k个不规则子区域,包括:以所述规则子区域内特征点之间的最小欧式距离为最优残差;根据所述规则子区域内特征点构建多项式回归模型,得到样本最大残差与所述最优残差最接近的多项式回归模型;基于所述多项式回归模型计算实际最大残差与最小残差,将所述实际最大残差与最小残差之和作为波动幅度;根据所述波动幅度确定多项式回归模型为轴的波动区域,得到不规则子区域。4.根据权利要求1所述的方法,其特征在于,所述敏感信息保护程度通过如下公式表示:i
i
=m
i
/q
i
;其中,q
i
表示第i个不规则子区域的大小,m
i
表示第i个不规则子区域内包含的特征点个数。5.根据权利要求1所述的方法,其特征在于,对各个所述不规则子区域计算敏感信息保护程度并分配隐私预算,根据所述隐私预算和计算得到的局部敏感度对所述不规则子区域添加扰动噪声,具体包括如下步骤:计算未添加保护的不规则子区域的敏感信息保护程度,将所述敏感信息保护程度输入打分函数,根据所述打分函数输出的各不规则区域概率,选择概率最高的不规则子区域作为当前区域;根据所述当前区域大小与所述未添加保护的不规则子区域大小的关系,分配隐私预算;根据所述隐私预算和局部敏感度对所述当前区域添加扰动噪声,所述扰动噪声为符合laplace分布的随机噪声;重复上述步骤,直至全部所述不规则子区域添加扰动噪声。6.根据权利要求5所述的方法,其特征在于,所述打分函数表示如下:
其中,p
i
为指数机制打分函数输出的各不规则区域概率,δq(x,i
i
)表示根据单个保护像素对细节点特征的保护程度i
i
设计的打分函数,i
i
为敏感信息保护程度,δu表示打分函数δq(x,i
i
)的敏感度,m表示从指纹图像中提取的特征点个数,ε1表示差分隐私指数机制消耗的隐私预算量,i表示k个待保护区域的保护程度集合。7.根据权利要求1所述的方法,其特征在于,所述局部敏感度通过如下公式表示:δq
gs
=max(δq
ls
);δq
ls
=max
x,x'
||q(x)-q(x
′
)||
ρ
;其中,q为查询函数,δq
ls
表示各不规则子区域的敏感度,δq
gs
表示局部敏感度,q(x)表示输入集合为x时的输出集合,q(x')表示输入集合为x'时的输出集合,x与x'表示相差一个数据的邻近数据集,x表示数据集x中的数据,x'表示数据集x'中的数据,ρ表示距离计算系数。8.根据权利要求1所述的方法,其特征在于,对所述不规则子区域添加扰动噪声时,根据差分隐私laplace机制添加扰动噪声,所述laplace机制分布的概率密度函数表示如下:据差分隐私laplace机制添加扰动噪声,所述laplace机制分布的概率密度函数表示如下:其中,x为被扰动的噪声数据,b为噪声的分布尺度,ε为隐私预算的大小,δq为敏感度大小,根据所述指纹图像的像素值为0-255,噪声的分布尺度b小于像素数据的最大波动幅度,即b≤256。9.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-8任一所述的方法。10.一种电子设备,包括处理器和存储装置,其特征在于,所述存储装置中存有多条指令,所述处理器用于读取所述存储装置中的多条指令并执行如权利要求1-8任一所述的方法。
技术总结
一种基于差分隐私保护的指纹图像局部保护发布方法及装置,涉及生物信息安全技术领域,方法包括:使用AGNES聚类算法对所述特征点进行分簇,得到K个包含所述特征点的规则子区域;对K个所述规则子区域内的特征点进行多项式回归,得到K个不规则子区域;根据所述不规则子区域中的特征点个数以及子区域大小,定义敏感信息保护程度;对各个所述不规则子区域计算敏感信息保护程度并分配隐私预算,根据所述隐私预算和计算得到的局部敏感度对各个所述不规则子区域添加扰动噪声;该方法依据指纹图像的匹配过程,对指纹图像进行分割提取包含特征点的敏感区域,并对敏感区域使用差分隐私技术进行保护,通过局部保护的方式实现指纹图像的全局保护效果。全局保护效果。全局保护效果。
技术研发人员:刘超 智照龙 赵伟男 牟春苗 何志成 任航
受保护的技术使用者:齐齐哈尔大学
技术研发日:2023.07.06
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/