印章真伪的鉴别方法、鉴别装置、存储介质与电子设备与流程
未命名
08-02
阅读:95
评论:0

1.本技术涉及印章真伪领域,具体而言,涉及一种印章真伪的鉴别方法、印章真伪的鉴别装置、可读存储介质和电子设备。
背景技术:
2.随着当今社会的飞速发展,印章的使用场景更是比比皆是。特别近年来,金融行业高速发展,金融业务百花竞放,印章在以银行为主要代表的金融业务中起着至关重要的作用,正因如此,在业务使用中确保印章的真实性也就变得尤其重要。
3.现有的印章种类繁多,其中圆形印章在银行对公业务往来中的使用最为普遍。目前常用的印章真伪鉴别方式仅是基于整体印章图像区域提取的特征主要表征了印章的整体结构和组成特征,而更关键的文本区域一般都只占印章全区域的一小部分,所以很容易受到印章其余区域的影响,从而导致表征印章真伪的关键特征有失真,导致对印章的真伪鉴别不准确的问题。
技术实现要素:
4.本技术的主要目的在于提供一种印章真伪的鉴别方法、印章真伪的鉴别装置、可读存储介质和电子设备,以至少解决现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。
5.为了实现上述目的,根据本技术的一个方面,提供了一种印章真伪的鉴别方法,包括:获取待鉴别印章图像,并提取所述待鉴别印章图像中的目标图像特征向量和所述待鉴别印章图像中的目标文字特征向量,所述待鉴别印章图像为待检测印章的图像;获取多个标准印章图像,并提取各所述标准印章图像中的标准图像特征向量和各所述标准印章图像中的标准文字特征向量;将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将所述第一相似度结果在第一相似度范围内的所述标准印章图像构建为第一标准印章集合;将所述目标文字特征向量和所述第一标准印章集合中的各所述标准印章图像对应的所述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将所述第二相似度结果在第二相似度范围内的所述标准印章图像构建为第二标准印章集合;在所述第二标准印章集合不为空的情况下,确定所述待检测印章为真印章,在所述第二标准印章集合为空的情况下,确定所述待检测印章为假印章。
6.可选地,在将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果之前,所述方法还包括:获取所述标准印章图像的标准文字图像;采用二阶贝塞尔曲线获取所述待鉴别印章图像的目标文字图像;将所述目标文字图像和各所述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将所述第三相似度结果在第三相似度范围内的所述标准印章图像构建为第三标准印章集合。
7.可选地,采用二阶贝塞尔曲线获取所述待鉴别印章图像的目标文字图像,包括:基于贝塞尔系数拟合出所述待鉴别印章图像的初始文字图像,所述初始文字图像为圆环形图
像;采用线性插值算法将所述初始文字图像转换为所述目标文字图像,所述目标文字图像为矩形图像。
8.可选地,将所述目标文字图像和各所述标准文字图像进行相似度匹配,得到多个第三相似度结果,包括:分别计算所述目标文字图像和各所述标准文字图像之间的编辑距离,得到多个所述编辑距离,其中,所述编辑距离的数值越大表示所述目标文字图像与所述标准文字图像的相似度越小,所述编辑距离的数值越小表示所述目标文字图像与所述标准文字图像的相似度越大;根据多个所述编辑距离,确定所述第三标准印章集合,其中,所述第三标准印章集合中的各所述标准印章图像和所述目标文字图像之间的所述编辑距离均在第一距离范围内,所述第三标准印章集合包括所述第一标准印章集合。
9.可选地,所述第三标准印章集合包括多个所述标准印章图像,将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,包括:分别计算所述目标图像特征向量和所述第三标准印章集合中的各所述标准印章图像对应的所述标准图像特征向量之间的余弦距离,得到多个所述余弦距离;根据多个所述余弦距离,确定所述第一标准印章集合,所述第一标准印章集合中的各所述标准印章图像和所述目标图像特征向量的余弦距离均在第二距离范围内。
10.可选地,提取所述待鉴别印章图像中的目标文字特征向量,包括:构建第一神经网络模型,其中,所述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与所述历史目标文字图像对应的历史文字特征向量,所述历史目标文字图像为包括目标文字的图像;根据所述第一神经网络模型和所述待鉴别印章图像,确定所述目标文字特征向量。
11.可选地,提取所述待鉴别印章图像中的目标图像特征向量,包括:构建第二神经网络模型,其中,所述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与所述印章图像对应的历史图像特征向量;根据所述第二神经网络模型和所述待鉴别印章图像,确定所述目标图像特征向量。
12.根据本技术的另一方面,提供了一种印章真伪的鉴别装置,包括:第一获取单元,用于获取待鉴别印章图像,并提取所述待鉴别印章图像中的目标图像特征向量和所述待鉴别印章图像中的目标文字特征向量,所述待鉴别印章图像为待检测印章的图像;第二获取单元,用于获取多个标准印章图像,并提取各所述标准印章图像中的标准图像特征向量和各所述标准印章图像中的标准文字特征向量;第一匹配单元,用于将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将所述第一相似度结果在第一相似度范围内的所述标准印章图像构建为第一标准印章集合;第二匹配单元,用于将所述目标文字特征向量和所述第一标准印章集合中的各所述标准印章图像对应的所述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将所述第二相似度结果在第二相似度范围内的所述标准印章图像构建为第二标准印章集合;确定单元,用于在所述第二标准印章集合不为空的情况下,确定所述待检测印章为真印章,在所述第二标准印章集合为空的情况下,确定所述待检测印章为假印章。
13.根据本技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储
介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行任意一种所述的印章真伪的鉴别方法。
14.根据本技术的另一方面,提供了一种电子设备,包括:一个或多个处理器,存储器,以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行任意一种所述的印章真伪的鉴别方法。
15.应用本技术的技术方案,上述印章真伪的鉴别方法,首先获取待鉴别印章图像,并提取待鉴别印章图像中的目标图像特征向量和待鉴别印章图像中的目标文字特征向量,待鉴别印章图像为待检测印章的图像;获取多个标准印章图像,并提取各标准印章图像中的标准图像特征向量和各标准印章图像中的标准文字特征向量;之后将目标图像特征向量和各标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将第一相似度结果在第一相似度范围内的标准印章图像构建为第一标准印章集合;将目标文字特征向量和第一标准印章集合中的各标准印章图像对应的标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将第二相似度结果在第二相似度范围内的标准印章图像构建为第二标准印章集合;最后在第二标准印章集合不为空的情况下,确定待检测印章为真印章,在第二标准印章集合为空的情况下,确定待检测印章为假印章。通过结合图像的粗特征匹配结果和文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征,解决了现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。
附图说明
16.构成本技术的一部分的说明书附图用来提供对本技术的进一步理解,本技术的示意性实施例及其说明用于解释本技术,并不构成对本技术的不当限定。在附图中:
17.图1示出了根据本技术的实施例中提供的一种执行印章真伪的鉴别方法的移动终端的硬件结构框图;
18.图2示出了根据本技术的实施例提供的一种印章真伪的鉴别方法的流程示意图;
19.图3示出了根据本技术的实施例提供的另一种印章真伪的鉴别方法的流程示意图;
20.图4示出了根据本技术的实施例提供的一种印章真伪的鉴别装置的结构框图。
具体实施方式
21.需要说明的是,在不冲突的情况下,本技术中的实施例及实施例中的特征可以相互组合。下面将参考附图并结合实施例来详细说明本技术。
22.为了使本技术领域的人员更好地理解本技术方案,下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本技术一部分的实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本技术保护的范围。
23.需要说明的是,本技术的说明书和权利要求书及上述附图中的术语“第一”、“第
二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本技术的实施例。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
24.为了便于描述,以下对本技术实施例涉及的部分名词或术语进行说明:
25.电子验印:电子验印是利用电子手段针对具体的业务核对账户中需要验印的印鉴与一张票据影像上的印鉴进行核对的过程,主要是通过数据的图形化,后台算法程序,模拟人工在柜台上验证票据真伪的方式。通过电子验印可以辅助银行,或其他机构验证票据所盖印章真伪,加快审核速度,降低错误识别率。
26.光学字符识别:光学字符识别(optical character recognition,ocr)是指在电子设备上检查纸质材料上的字符,然后用字符识别方法将形状翻译成计算机文字的过程;即对文本资料进行扫描,然后对图像文件进行分析处理,获取文字及版面信息的过程。
27.正如背景技术中所介绍的,现有的业务使用中确保印章的真实性非常重要,其中,现有技术中常用的印章真伪鉴别方式主要有:1、通过人工核验对印章进行真伪鉴别;2、采用传统计算机视觉技术对印章进行真伪鉴别;3、采用人工智能技术对印章进行真伪鉴别。其中,人工核验方式对从业人员有较高的技术门槛,通常需要从业人员具备扎实的专业技能和丰富的从业经验,并且需要大量的人力投入,核验效率较低;采用传统计算机视觉技术进行印章核验的方式主要局限于图像传统特征的表征能力不足,其特征不足以全面地对印章真伪进行核验;基于人工智能技术的鉴别方式可以很好地解决效率低下与特征表征问题。
28.正如上述内容,基于人工核验对印章真伪进行鉴别的方式主要是依靠专业人员从印章的字体、颜色、形状、角度等各方面进行核验。
29.采用传统计算机视觉技术进行印章真伪鉴别是指通过图像二值化处理、图像增强处理、以及基于人工设计的特征提取等对印章图像进行技术上的综合鉴别。sift(尺度不变特征变换)是最常用的人工设计特征之一,它具有旋转、尺度及亮度不变性,因此可以采用这些特征点匹配的方式进行印章核验。二值化、图像增强等技术主要用来对印章图像进行预处理。
30.近年来,随着大数据、云计算以及人工智能(artificial intelligence,简称为ai)算法特别是深度学习算法的迅速发展,人工智能技术已逐步规模化地应用到了各行各业,所以在印章核验方面也毫不例外。基于人工智能技术的印章核验方法主要包括两方面的应用:一种是采用基于深度学习的ocr(光学字符识别)技术对印章文字进行识别,从字符级别的角度对印章真伪性进行鉴别;另外一种是采用深度学习模型提取印章图像特征向量,通过较强的表征特征对印章进行比对核验。其主要步骤如下:
31.(1)对输入图像进行印章检测,圈定印章图像区域;
32.(2)采用深度学习模型对印章图像区域进行文本检测与识别;
33.(3)采用深度学习模型对印章图像区域进行特征向量提取;
34.(4)结合文本相似性与特征向量相似性综合进行印章真伪鉴别。
35.目前现有该方法的不足是基于整体印章图像区域提取的特征主要表征了印章的
整体结构和组成特征,而更关键的文本区域很容易受到印章其余区域的影响,从而导致表征印章真伪的关键特征有失真。
36.为解决现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题,本技术的实施例提供了一种印章真伪的鉴别方法、印章真伪的鉴别装置、可读存储介质和电子设备。
37.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述。
38.本技术实施例中所提供的方法实施例可以在移动终端、计算机终端或者类似的运算装置中执行。以运行在移动终端上为例,图1是本发明实施例的一种印章真伪的鉴别方法的移动终端的硬件结构框图。如图1所示,移动终端可以包括一个或多个(图1中仅示出一个)处理器102(处理器102可以包括但不限于微处理器mcu或可编程逻辑器件fpga等的处理装置)和用于存储数据的存储器104,其中,上述移动终端还可以包括用于通信功能的传输设备106以及输入输出设备108。本领域普通技术人员可以理解,图1所示的结构仅为示意,其并不对上述移动终端的结构造成限定。例如,移动终端还可包括比图1中所示更多或者更少的组件,或者具有与图1所示不同的配置。
39.存储器104可用于存储计算机程序,例如,应用软件的软件程序以及模块,如本发明实施例中的印章真伪的鉴别方法对应的计算机程序,处理器102通过运行存储在存储器104内的计算机程序,从而执行各种功能应用以及数据处理,即实现上述的方法。存储器104可包括高速随机存储器,还可包括非易失性存储器,如一个或者多个磁性存储装置、闪存、或者其他非易失性固态存储器。在一些实例中,存储器104可进一步包括相对于处理器102远程设置的存储器,这些远程存储器可以通过网络连接至移动终端。上述网络的实例包括但不限于互联网、企业内部网、局域网、移动通信网及其组合。传输设备106用于经由一个网络接收或者发送数据。上述的网络具体实例可包括移动终端的通信供应商提供的无线网络。在一个实例中,传输设备106包括一个网络适配器(network interface controller,简称为nic),其可通过基站与其他网络设备相连从而可与互联网进行通讯。在一个实例中,传输设备106可以为射频(radio frequency,简称为rf)模块,其用于通过无线方式与互联网进行通讯。
40.在本实施例中提供了一种运行于移动终端、计算机终端或者类似的运算装置的
…
方法,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
41.图2是根据本技术实施例的印章真伪的鉴别方法的流程图。如图2所示,该方法包括以下步骤:
42.步骤s201,获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;
43.具体地,一般情况下需要将待鉴别印章图像扫描至鉴别控制器中,其中,输入的图片支持jpg、bmp、png等常见的图像格式,并且输入的图像中至少包含有一个圆形印章,之后采用yolov4深度学习模型对待鉴别印章进行定位,截取待鉴别印章的外接正方形的区域为目标区域。并且,因为印章属于较好检测的目标,所以一般情况下可以采用性能较好的
yolov4深度学习模型进行印章目标检测定位,在保证良好效果的前提下也能提高效率且提升了模型预测性能。此外,还可以采用其他深度学习模型来进行训练。
44.其中,提取上述待鉴别印章图像中的目标图像特征向量的具体实施步骤如下:
45.步骤s2011,构建第二神经网络模型,其中,上述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与上述印章图像对应的历史图像特征向量;
46.步骤s2012,根据上述第二神经网络模型和上述待鉴别印章图像,确定上述目标图像特征向量。
47.具体地,采用resnet50卷积神经网络模型提取,其中,该模型是采用tripletloss(三元组损失)训练的模型,采用tripletloss训练出来的模型精确度更高,可以保证同一枚印章的两幅图像之间的特征尽可能接近(相似性大)而不同印章间的特征差异尽可能大(相似性小),可以更准确的鉴别印章的真伪。
48.步骤s202,获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;
49.具体地,由于圆形印章角度多样,不同旋转角度的印章,其特征匹配都会受到一定影响;其次,文本区域一般只占到整个圆形印章的一小部分,基于完整印章提取的特征匹配很容易受到背景等无关内容的影响。而文本区域特征提取可以尽可能地只提取部分最重要的印章特征,以避免因为roi(region of interest)过大而带来更多的噪声。
50.在执行步骤s202之后,执行步骤s203之前,还包括下述步骤:
51.步骤s301,获取上述标准印章图像的标准文字图像;
52.步骤s302,采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像;
53.其中,步骤s302的具体实施步骤如下:
54.步骤s3021,基于贝塞尔系数拟合出上述待鉴别印章图像的初始文字图像,上述初始文字图像为圆环形图像;
55.步骤s3022,采用线性插值算法将上述初始文字图像转换为上述目标文字图像,上述目标文字图像为矩形图像。
56.具体地,基于二阶贝塞尔曲线的文字检测方法,即通过模型回归贝塞尔系数,从而拟合出初始文字图像,之后采用线性插值方法,将初始文字图像进行对齐处理,从而将弯曲的圆环形文字区域映射转化到矩形文字区域,之后采用crnn(convolutional recurrent neural network,卷积循环神经网络)模型对矩形文字区域中的文字进行文字识别,这样可以较好地解决弯曲文本的检测不精准的问题,并且文本区域图像的对齐可以把弯曲文本对齐映射到矩形文本框中,在一定程度上消除了因为不同旋转角度造成的文本特征不一致问题。
57.其中,提取上述待鉴别印章图像中的目标文字特征向量的具体实施步骤还包括:
58.步骤s2013,构建第一神经网络模型,其中,上述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与上述历史目标文字图像对应的历史文字特征向量,上述历史目标文字图像为包括目标文字的图像
59.步骤s2014,根据上述第一神经网络模型和上述待鉴别印章图像,确定上述目标文
字特征向量。
60.具体地,采用resnet50卷积神经网络模型对矩形的目标文字图像进行目标文字特征向量的提取,其中,该模型同样是采用tripletloss(三元组损失)训练的模型,从而保证了同一枚印章的两幅图像之间的特征尽可能接近(相似性大)而不同印章间的特征差异尽可能大(相似性小)。
61.步骤s303,将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将上述第三相似度结果在第三相似度范围内的上述标准印章图像构建为第三标准印章集合。
62.具体地,当第三标准印章集合为空的情况下,证明待鉴别印章为假印章,而先对目标文字图像和各标准文字图像进行比对得到第三标准印章集合,可以在一定程度上消除了因为不同旋转角度造成的文本特征不一致问题。
63.其中,步骤s303的具体实施步骤如下:
64.步骤s3031,分别计算上述目标文字图像和各上述标准文字图像之间的编辑距离,得到多个上述编辑距离,其中,上述编辑距离的数值越大表示上述目标文字图像与上述标准文字图像的相似度越小,上述编辑距离的数值越小表示上述目标文字图像与上述标准文字图像的相似度越大;
65.步骤s3032,根据多个上述编辑距离,确定上述第三标准印章集合,其中,上述第三标准印章集合中的各上述标准印章图像和上述目标文字图像之间的上述编辑距离均在第一距离范围内,上述第三标准印章集合包括上述第一标准印章集合。
66.具体地,目标文字图像和各标准文字图像之间的相似度通过编辑距离来表示,其中,假设文本a和文本b的编辑距离为ed(a,b),则相似度可表示为所以文中的编辑距离指的是归一化后的距离,取值通常设0~0.2,此时对应的相似度范围为0.8~1,即第一距离范围可以为0~0.2,这样可以消除印章其他区域对关键的文本区域的影响,使得印章鉴别的准确度更高。
67.步骤s203,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;
68.具体地,一般情况下只需将目标图像特征向量和第三标准印章集合中的各标准印章图像的标准图像特征向量进行相似度匹配即可,并且如果第一标准印章集合为空的情况下,则确认待鉴别印章为假印章,这样可以提高鉴别速度,节省鉴别成本。
69.其中,上述第三标准印章集合包括多个上述标准印章图像,步骤s203的具体实施步骤如下:
70.步骤s2031,分别计算上述目标图像特征向量和上述第三标准印章集合中的各上述标准印章图像对应的上述标准图像特征向量之间的余弦距离,得到多个上述余弦距离;
71.步骤s2032,根据多个上述余弦距离,确定上述第一标准印章集合,上述第一标准印章集合中的各上述标准印章图像和上述目标图像特征向量的余弦距离均在第二距离范围内。
72.具体地,第二距离范围一般为0~0.2,首先根据图像特征向量进行一个粗特征匹
配,可以根据粗特征匹配结果先排除掉一部分标准印章图像,之后再对筛选出的标准印章图像进行进行文本区域的精特征匹配,可以在保证准确度的基础上节省鉴别成本。
73.步骤s204,将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;
74.具体地,一般情况下只需将目标文字特征向量和第一标准印章集合中的各标准印章图像对应的标准文字特征向量进行相似度匹配,这样可以提高鉴别速度,节省鉴别成本。
75.步骤s205,在上述第二标准印章集合不为空的情况下,确定上述待检测印章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。
76.具体地,结合基于ocr(optical character recognition,光学字符识别)的字符级的核验结果、完整印章的粗特征匹配结果以及文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征。
77.本技术的上述印章真伪的鉴别方法,首先获取待鉴别印章图像,并提取待鉴别印章图像中的目标图像特征向量和待鉴别印章图像中的目标文字特征向量,待鉴别印章图像为待检测印章的图像;获取多个标准印章图像,并提取各标准印章图像中的标准图像特征向量和各标准印章图像中的标准文字特征向量;之后将目标图像特征向量和各标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将第一相似度结果在第一相似度范围内的标准印章图像构建为第一标准印章集合;将目标文字特征向量和第一标准印章集合中的各标准印章图像对应的标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将第二相似度结果在第二相似度范围内的标准印章图像构建为第二标准印章集合;最后在第二标准印章集合不为空的情况下,确定待检测印章为真印章,在第二标准印章集合为空的情况下,确定待检测印章为假印章。通过结合图像的粗特征匹配结果和文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征,解决了现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。
78.为了使得本领域技术人员能够更加清楚地了解本技术的技术方案,以下将结合具体的实施例对本技术的印章真伪的鉴别方法的实现过程进行详细说明。
79.本实施例涉及一种具体的印章真伪的鉴别方法,如图3所示,包括如下步骤:
80.步骤s1:输入图片支持jpg、bmp、png等常见的图像格式,要求输入图像至少包含有一个圆形印章。
81.步骤s2:印章检测。因为印章属于较好检测的目标,所以本方案采用性能较好的yolov4深度学习模型进行印章目标检测定位,在保证良好效果的前提下也提升了模型预测性能。
82.步骤s3:文字区域检测。为了较好地解决弯曲文本的检测,本方案采用了基于二阶贝塞尔曲线的文字检测方法,即通过模型回归贝塞尔系数,从而拟合出弯曲文字区域。
83.步骤s4:印章文字对齐。采用线性插值方法,将步骤s3中得到的印章文字进行对齐处理,从而将弯曲的文字区域映射转化到矩形文字区域。
84.步骤s5:文字识别。将步骤s4中得到的矩形文本图像,采用crnn模型进行文字识
别。
85.步骤s6:计算步骤s5得到的文本信息和底库标准印章的文本信息之间的相似度,该相似度可以通过计算文本间编辑距离来表示,且编辑距离越大,表示相似度越小。设定一定阈值选择满足条件的印章候选集合,若该候选集合为空,则返回核验不通过结果;否则继续下面的步骤。
86.步骤s7:印章特征提取。针对步骤s2中得到的完整的印章目标区域,采用resnet50卷积神经网络模型进行特征提取,该模型是采用tripletloss(三元组损失)训练的模型,从而保证了同一枚印章的两幅图像之间的特征尽可能接近(相似性大)而不同印章间的特征差异尽可能大(相似性小)。
87.步骤s8:粗特征匹配。计算步骤s7中得到的印章特征和步骤s6中得到的印章候选集合的特征之间的相似度,该相似度可以通过计算余弦距离来表示。设定一定的阈值选择满足条件的印章候选集合,若该候选集合为空,则返回核验不通过结果;否则继续下面的步骤。
88.步骤s9:文字区域特征提取。针对步骤s4得到的对齐的文本图像,采用resnet50+tripletloss训练的卷积神经网络模型进行特征提取。
89.步骤s10:精特征匹配。计算步骤s9中得到的印章特征和步骤s8中得到的印章候选集合的特征之间的相似度,设定一定的阈值选择满足条件的印章候选集合,若该候选集合为空,则返回核验不通过结果;否则,说明核验通过。
90.需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。
91.本技术实施例还提供了一种印章真伪的鉴别装置,需要说明的是,本技术实施例的印章真伪的鉴别装置可以用于执行本技术实施例所提供的用于印章真伪的鉴别方法。该装置用于实现上述实施例及优选实施方式,已经进行过说明的不再赘述。如以下所使用的,术语“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
92.以下对本技术实施例提供的印章真伪的鉴别装置进行介绍。
93.图4是根据本技术实施例的印章真伪的鉴别装置的示意图。如图4所示,该装置包括第一获取单元10、第二获取单元20、第一匹配单元30、第二匹配单元40和确定单元50,第一获取单元10用于获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;第二获取单元20用于获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;第一匹配单元30用于将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;第二匹配单元40用于将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;确定单元50用于在上述第二标准印章集合不为空的情况下,确定上述待检测印
章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。
94.本技术的上述印章真伪的鉴别装置,包括第一获取单元、第二获取单元、第一匹配单元、第二匹配单元和确定单元,第一获取单元用于获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;第二获取单元用于获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;第一匹配单元用于将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;第二匹配单元用于将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;确定单元用于在上述第二标准印章集合不为空的情况下,确定上述待检测印章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。通过结合图像的粗特征匹配结果和文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征,解决了现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。
95.作为一种可选的方案,上述装置还包括第三获取单元、第四获取单元和第三匹配单元,第三获取单元用于在将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果之前,获取上述标准印章图像的标准文字图像;第四获取单元用于采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像;第三匹配单元用于将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将上述第三相似度结果在第三相似度范围内的上述标准印章图像构建为第三标准印章集合。可以在一定程度上消除了因为不同旋转角度造成的文本特征不一致问题。
96.示例性的,第四获取单元包括拟合子单元和转换子单元,拟合子单元用于基于贝塞尔系数拟合出上述待鉴别印章图像的初始文字图像,上述初始文字图像为圆环形图像;转换子单元用于采用线性插值算法将上述初始文字图像转换为上述目标文字图像,上述目标文字图像为矩形图像。可以较好地解决弯曲文本的检测不精准的问题,并且文本区域图像的对齐可以把弯曲文本对齐映射到矩形文本框中,在一定程度上消除了因为不同旋转角度造成的文本特征不一致问题。
97.可选的示例中,第三匹配单元包括第一计算子单元和第二确定子单元,第一计算子单元用于分别计算上述目标文字图像和各上述标准文字图像之间的编辑距离,得到多个上述编辑距离,其中,上述编辑距离的数值越大表示上述目标文字图像与上述标准文字图像的相似度越小,上述编辑距离的数值越小表示上述目标文字图像与上述标准文字图像的相似度越大;第二确定子单元用于根据多个上述编辑距离,确定上述第三标准印章集合,其中,上述第三标准印章集合中的各上述标准印章图像和上述目标文字图像之间的上述编辑距离均在第一距离范围内,上述第三标准印章集合包括上述第一标准印章集合。可以消除印章其他区域对关键的文本区域的影响,使得印章鉴别的准确度更高。
98.在一个可选的实施例中,上述第三标准印章集合包括多个上述标准印章图像,第一匹配单元包括第二计算子单元和第二确定子单元,第二计算子单元用于分别计算上述目
标图像特征向量和上述第三标准印章集合中的各上述标准印章图像对应的上述标准图像特征向量之间的余弦距离,得到多个上述余弦距离;第二确定子单元用于根据多个上述余弦距离,确定上述第一标准印章集合,上述第一标准印章集合中的各上述标准印章图像和上述目标图像特征向量的余弦距离均在第二距离范围内。可以在保证准确度的基础上节省鉴别成本。
99.在一个可选的方案中,第一获取单元包括第一构建子单元和第三确定子单元,第一构建子单元用于构建第一神经网络模型,其中,上述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与上述历史目标文字图像对应的历史文字特征向量,上述历史目标文字图像为包括目标文字的图像;第三确定子单元根据上述第一神经网络模型和上述待鉴别印章图像,确定上述目标文字特征向量。保证了同一枚印章的两幅图像之间的特征尽可能接近(相似性大)而不同印章间的特征差异尽可能大(相似性小)。
100.示例性的,第一获取单元包括第二构建子单元和第四确定子单元,第二构建子单元用于构建第二神经网络模型,其中,上述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与上述印章图像对应的历史图像特征向量;第四确定子单元用于根据上述第二神经网络模型和上述待鉴别印章图像,确定上述目标图像特征向量。可以保证同一枚印章的两幅图像之间的特征尽可能接近(相似性大)而不同印章间的特征差异尽可能大(相似性小),可以更准确的鉴别印章的真伪。
101.上述印章真伪的鉴别装置包括处理器和存储器,上述第一获取单元等均作为程序单元存储在存储器中,由处理器执行存储在存储器中的上述程序单元来实现相应的功能。上述模块均位于同一处理器中;或者,上述各个模块以任意组合的形式分别位于不同的处理器中。
102.处理器中包含内核,由内核去存储器中调取相应的程序单元。内核可以设置一个或以上,通过调整内核参数来解决现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。
103.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram),存储器包括至少一个存储芯片。
104.本发明实施例提供了一种计算机可读存储介质,上述计算机可读存储介质包括存储的程序,其中,在上述程序运行时控制上述计算机可读存储介质所在设备执行上述印章真伪的鉴别方法。
105.具体地,印章真伪的鉴别方法包括:
106.步骤s201,获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;
107.具体地,一般情况下需要将待鉴别印章图像扫描至鉴别控制器中,其中,输入的图片支持jpg、bmp、png等常见的图像格式,并且输入的图像中至少包含有一个圆形印章,之后
采用yolov4深度学习模型对待鉴别印章进行定位,截取待鉴别印章的外接正方形的区域为目标区域。并且,因为印章属于较好检测的目标,所以一般情况下可以采用性能较好的yolov4深度学习模型进行印章目标检测定位,在保证良好效果的前提下也能提高效率且提升了模型预测性能。此外,还可以采用其他深度学习模型来进行训练。
108.步骤s202,获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;
109.具体地,由于圆形印章角度多样,不同旋转角度的印章,其特征匹配都会受到一定影响;其次,文本区域一般只占到整个圆形印章的一小部分,基于完整印章提取的特征匹配很容易受到背景等无关内容的影响。而文本区域特征提取可以尽可能地只提取部分最重要的印章特征,以避免因为roi(region of interest)过大而带来更多的噪声。
110.步骤s203,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;
111.具体地,一般情况下只需将目标图像特征向量和第三标准印章集合中的各标准印章图像的标准图像特征向量进行相似度匹配即可,并且如果第一标准印章集合为空的情况下,则确认待鉴别印章为假印章,这样可以提高鉴别速度,节省鉴别成本。
112.步骤s204,将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;
113.具体地,一般情况下只需将目标文字特征向量和第一标准印章集合中的各标准印章图像对应的标准文字特征向量进行相似度匹配,这样可以提高鉴别速度,节省鉴别成本。
114.步骤s205,在上述第二标准印章集合不为空的情况下,确定上述待检测印章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。
115.具体地,结合基于ocr(optical character recognition,光学字符识别)的字符级的核验结果、完整印章的粗特征匹配结果以及文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征。
116.可选地,在将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果之前,上述方法还包括:获取上述标准印章图像的标准文字图像;采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像;将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将上述第三相似度结果在第三相似度范围内的上述标准印章图像构建为第三标准印章集合。
117.可选地,采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像,包括:基于贝塞尔系数拟合出上述待鉴别印章图像的初始文字图像,上述初始文字图像为圆环形图像;采用线性插值算法将上述初始文字图像转换为上述目标文字图像,上述目标文字图像为矩形图像。
118.可选地,将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,包括:分别计算上述目标文字图像和各上述标准文字图像之间的编辑距离,得到多个上述编辑距离,其中,上述编辑距离的数值越大表示上述目标文字图像与上述
标准文字图像的相似度越小,上述编辑距离的数值越小表示上述目标文字图像与上述标准文字图像的相似度越大;根据多个上述编辑距离,确定上述第三标准印章集合,其中,上述第三标准印章集合中的各上述标准印章图像和上述目标文字图像之间的上述编辑距离均在第一距离范围内,上述第三标准印章集合包括上述第一标准印章集合。
119.可选地,上述第三标准印章集合包括多个上述标准印章图像,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,包括:分别计算上述目标图像特征向量和上述第三标准印章集合中的各上述标准印章图像对应的上述标准图像特征向量之间的余弦距离,得到多个上述余弦距离;根据多个上述余弦距离,确定上述第一标准印章集合,上述第一标准印章集合中的各上述标准印章图像和上述目标图像特征向量的余弦距离均在第二距离范围内。
120.可选地,提取上述待鉴别印章图像中的目标文字特征向量,包括:构建第一神经网络模型,其中,上述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与上述历史目标文字图像对应的历史文字特征向量,上述历史目标文字图像为包括目标文字的图像;根据上述第一神经网络模型和上述待鉴别印章图像,确定上述目标文字特征向量。
121.可选地,提取上述待鉴别印章图像中的目标图像特征向量,包括:构建第二神经网络模型,其中,上述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与上述印章图像对应的历史图像特征向量;根据上述第二神经网络模型和上述待鉴别印章图像,确定上述目标图像特征向量。
122.本发明实施例提供了一种处理器,上述处理器用于运行程序,其中,上述程序运行时执行上述印章真伪的鉴别方法。
123.具体地,印章真伪的鉴别方法包括:
124.步骤s201,获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;
125.具体地,一般情况下需要将待鉴别印章图像扫描至鉴别控制器中,其中,输入的图片支持jpg、bmp、png等常见的图像格式,并且输入的图像中至少包含有一个圆形印章,之后采用yolov4深度学习模型对待鉴别印章进行定位,截取待鉴别印章的外接正方形的区域为目标区域。并且,因为印章属于较好检测的目标,所以一般情况下可以采用性能较好的yolov4深度学习模型进行印章目标检测定位,在保证良好效果的前提下也能提高效率且提升了模型预测性能。此外,还可以采用其他深度学习模型来进行训练。
126.步骤s202,获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;
127.具体地,由于圆形印章角度多样,不同旋转角度的印章,其特征匹配都会受到一定影响;其次,文本区域一般只占到整个圆形印章的一小部分,基于完整印章提取的特征匹配很容易受到背景等无关内容的影响。而文本区域特征提取可以尽可能地只提取部分最重要的印章特征,以避免因为roi(region of interest)过大而带来更多的噪声。
128.步骤s203,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;
129.具体地,一般情况下只需将目标图像特征向量和第三标准印章集合中的各标准印章图像的标准图像特征向量进行相似度匹配即可,并且如果第一标准印章集合为空的情况下,则确认待鉴别印章为假印章,这样可以提高鉴别速度,节省鉴别成本。
130.步骤s204,将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;
131.具体地,一般情况下只需将目标文字特征向量和第一标准印章集合中的各标准印章图像对应的标准文字特征向量进行相似度匹配,这样可以提高鉴别速度,节省鉴别成本。
132.步骤s205,在上述第二标准印章集合不为空的情况下,确定上述待检测印章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。
133.具体地,结合基于ocr(optical character recognition,光学字符识别)的字符级的核验结果、完整印章的粗特征匹配结果以及文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征。
134.可选地,在将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果之前,上述方法还包括:获取上述标准印章图像的标准文字图像;采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像;将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将上述第三相似度结果在第三相似度范围内的上述标准印章图像构建为第三标准印章集合。
135.可选地,采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像,包括:基于贝塞尔系数拟合出上述待鉴别印章图像的初始文字图像,上述初始文字图像为圆环形图像;采用线性插值算法将上述初始文字图像转换为上述目标文字图像,上述目标文字图像为矩形图像。
136.可选地,将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,包括:分别计算上述目标文字图像和各上述标准文字图像之间的编辑距离,得到多个上述编辑距离,其中,上述编辑距离的数值越大表示上述目标文字图像与上述标准文字图像的相似度越小,上述编辑距离的数值越小表示上述目标文字图像与上述标准文字图像的相似度越大;根据多个上述编辑距离,确定上述第三标准印章集合,其中,上述第三标准印章集合中的各上述标准印章图像和上述目标文字图像之间的上述编辑距离均在第一距离范围内,上述第三标准印章集合包括上述第一标准印章集合。
137.可选地,上述第三标准印章集合包括多个上述标准印章图像,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,包括:分别计算上述目标图像特征向量和上述第三标准印章集合中的各上述标准印章图像对应的上述标准图像特征向量之间的余弦距离,得到多个上述余弦距离;根据多个上述余弦距离,确定上述第一标准印章集合,上述第一标准印章集合中的各上述标准印章图像和上述目标图像特征向量的余弦距离均在第二距离范围内。
138.可选地,提取上述待鉴别印章图像中的目标文字特征向量,包括:构建第一神经网络模型,其中,上述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与上述历史目标文字图像对应的历史文字特征向量,上述历史目标文字图像为包括目标文字的图像;根据上述第一神经网络模型和上述待鉴别印章图像,确定上述目标文字特征向量。
139.可选地,提取上述待鉴别印章图像中的目标图像特征向量,包括:构建第二神经网络模型,其中,上述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与上述印章图像对应的历史图像特征向量;根据上述第二神经网络模型和上述待鉴别印章图像,确定上述目标图像特征向量。
140.本发明实施例提供了一种设备,设备包括处理器、存储器及存储在存储器上并可在处理器上运行的程序,处理器执行程序时实现至少以下步骤:
141.具体地,印章真伪的鉴别方法包括:
142.步骤s201,获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;
143.步骤s202,获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;
144.步骤s203,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;
145.步骤s204,将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;
146.步骤s205,在上述第二标准印章集合不为空的情况下,确定上述待检测印章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。
147.本文中的设备可以是服务器、pc、pad、手机等。
148.可选地,在将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果之前,上述方法还包括:获取上述标准印章图像的标准文字图像;采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像;将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将上述第三相似度结果在第三相似度范围内的上述标准印章图像构建为第三标准印章集合。
149.可选地,采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像,包括:基于贝塞尔系数拟合出上述待鉴别印章图像的初始文字图像,上述初始文字图像为圆环形图像;采用线性插值算法将上述初始文字图像转换为上述目标文字图像,上述目标文字图像为矩形图像。
150.可选地,将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,包括:分别计算上述目标文字图像和各上述标准文字图像之间的编辑距
离,得到多个上述编辑距离,其中,上述编辑距离的数值越大表示上述目标文字图像与上述标准文字图像的相似度越小,上述编辑距离的数值越小表示上述目标文字图像与上述标准文字图像的相似度越大;根据多个上述编辑距离,确定上述第三标准印章集合,其中,上述第三标准印章集合中的各上述标准印章图像和上述目标文字图像之间的上述编辑距离均在第一距离范围内,上述第三标准印章集合包括上述第一标准印章集合。
151.可选地,上述第三标准印章集合包括多个上述标准印章图像,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,包括:分别计算上述目标图像特征向量和上述第三标准印章集合中的各上述标准印章图像对应的上述标准图像特征向量之间的余弦距离,得到多个上述余弦距离;根据多个上述余弦距离,确定上述第一标准印章集合,上述第一标准印章集合中的各上述标准印章图像和上述目标图像特征向量的余弦距离均在第二距离范围内。
152.可选地,提取上述待鉴别印章图像中的目标文字特征向量,包括:构建第一神经网络模型,其中,上述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与上述历史目标文字图像对应的历史文字特征向量,上述历史目标文字图像为包括目标文字的图像;根据上述第一神经网络模型和上述待鉴别印章图像,确定上述目标文字特征向量。
153.可选地,提取上述待鉴别印章图像中的目标图像特征向量,包括:构建第二神经网络模型,其中,上述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与上述印章图像对应的历史图像特征向量;根据上述第二神经网络模型和上述待鉴别印章图像,确定上述目标图像特征向量。
154.本技术还提供了一种计算机程序产品,当在数据处理设备上执行时,适于执行初始化有至少如下方法步骤的程序:
155.步骤s201,获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;
156.步骤s202,获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;
157.步骤s203,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;
158.步骤s204,将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;
159.步骤s205,在上述第二标准印章集合不为空的情况下,确定上述待检测印章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。
160.可选地,在将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果之前,上述方法还包括:获取上述标准印章图像的标准文字图
像;采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像;将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将上述第三相似度结果在第三相似度范围内的上述标准印章图像构建为第三标准印章集合。
161.可选地,采用二阶贝塞尔曲线获取上述待鉴别印章图像的目标文字图像,包括:基于贝塞尔系数拟合出上述待鉴别印章图像的初始文字图像,上述初始文字图像为圆环形图像;采用线性插值算法将上述初始文字图像转换为上述目标文字图像,上述目标文字图像为矩形图像。
162.可选地,将上述目标文字图像和各上述标准文字图像进行相似度匹配,得到多个第三相似度结果,包括:分别计算上述目标文字图像和各上述标准文字图像之间的编辑距离,得到多个上述编辑距离,其中,上述编辑距离的数值越大表示上述目标文字图像与上述标准文字图像的相似度越小,上述编辑距离的数值越小表示上述目标文字图像与上述标准文字图像的相似度越大;根据多个上述编辑距离,确定上述第三标准印章集合,其中,上述第三标准印章集合中的各上述标准印章图像和上述目标文字图像之间的上述编辑距离均在第一距离范围内,上述第三标准印章集合包括上述第一标准印章集合。
163.可选地,上述第三标准印章集合包括多个上述标准印章图像,将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,包括:分别计算上述目标图像特征向量和上述第三标准印章集合中的各上述标准印章图像对应的上述标准图像特征向量之间的余弦距离,得到多个上述余弦距离;根据多个上述余弦距离,确定上述第一标准印章集合,上述第一标准印章集合中的各上述标准印章图像和上述目标图像特征向量的余弦距离均在第二距离范围内。
164.可选地,提取上述待鉴别印章图像中的目标文字特征向量,包括:构建第一神经网络模型,其中,上述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与上述历史目标文字图像对应的历史文字特征向量,上述历史目标文字图像为包括目标文字的图像;根据上述第一神经网络模型和上述待鉴别印章图像,确定上述目标文字特征向量。
165.可选地,提取上述待鉴别印章图像中的目标图像特征向量,包括:构建第二神经网络模型,其中,上述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,上述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与上述印章图像对应的历史图像特征向量;根据上述第二神经网络模型和上述待鉴别印章图像,确定上述目标图像特征向量。
166.显然,本领域的技术人员应该明白,上述的本发明的各模块或各步骤可以用通用的计算装置来实现,它们可以集中在单个的计算装置上,或者分布在多个计算装置所组成的网络上,它们可以用计算装置可执行的程序代码来实现,从而,可以将它们存储在存储装置中由计算装置来执行,并且在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤,或者将它们分别制作成各个集成电路模块,或者将它们中的多个模块或步骤制作成单个集成电路模块来实现。这样,本发明不限制于任何特定的硬件和软件结合。
167.本领域内的技术人员应明白,本技术的实施例可提供为方法、系统、或计算机程序产品。因此,本技术可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实
施例的形式。而且,本技术可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器、cd-rom、光学存储器等)上实施的计算机程序产品的形式。
168.本技术是参照根据本技术实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器,使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
169.这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中,使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品,该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
170.这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上,使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理,从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
171.在一个典型的配置中,计算设备包括一个或多个处理器(cpu)、输入/输出接口、网络接口和内存。
172.存储器可能包括计算机可读介质中的非永久性存储器,随机存取存储器(ram)和/或非易失性内存等形式,如只读存储器(rom)或闪存(flash ram)。存储器是计算机可读介质的示例。
173.计算机可读介质包括永久性和非永久性、可移动和非可移动媒体可以由任何方法或技术来实现信息存储。信息可以是计算机可读指令、数据结构、程序的模块或其他数据。计算机的存储介质的例子包括,但不限于相变内存(pram)、静态随机存取存储器(sram)、动态随机存取存储器(dram)、其他类型的随机存取存储器(ram)、只读存储器(rom)、电可擦除可编程只读存储器(eeprom)、快闪记忆体或其他内存技术、只读光盘只读存储器(cd-rom)、数字多功能光盘(dvd)或其他光学存储、磁盒式磁带,磁带磁磁盘存储或其他磁性存储设备或任何其他非传输介质,可用于存储可以被计算设备访问的信息。按照本文中的界定,计算机可读介质不包括暂存电脑可读媒体(transitory media),如调制的数据信号和载波。
174.还需要说明的是,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、商品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、商品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括要素的过程、方法、商品或者设备中还存在另外的相同要素。
175.从以上的描述中,可以看出,本技术上述的实施例实现了如下技术效果:
176.1)、本技术的上述印章真伪的鉴别方法,首先获取待鉴别印章图像,并提取待鉴别印章图像中的目标图像特征向量和待鉴别印章图像中的目标文字特征向量,待鉴别印章图像为待检测印章的图像;获取多个标准印章图像,并提取各标准印章图像中的标准图像特
征向量和各标准印章图像中的标准文字特征向量;之后将目标图像特征向量和各标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将第一相似度结果在第一相似度范围内的标准印章图像构建为第一标准印章集合;将目标文字特征向量和第一标准印章集合中的各标准印章图像对应的标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将第二相似度结果在第二相似度范围内的标准印章图像构建为第二标准印章集合;最后在第二标准印章集合不为空的情况下,确定待检测印章为真印章,在第二标准印章集合为空的情况下,确定待检测印章为假印章。通过结合图像的粗特征匹配结果和文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征,解决了现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。
177.2)、本技术的上述印章真伪的鉴别装置,包括第一获取单元、第二获取单元、第一匹配单元、第二匹配单元和确定单元,第一获取单元用于获取待鉴别印章图像,并提取上述待鉴别印章图像中的目标图像特征向量和上述待鉴别印章图像中的目标文字特征向量,上述待鉴别印章图像为待检测印章的图像;第二获取单元用于获取多个标准印章图像,并提取各上述标准印章图像中的标准图像特征向量和各上述标准印章图像中的标准文字特征向量;第一匹配单元用于将上述目标图像特征向量和各上述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将上述第一相似度结果在第一相似度范围内的上述标准印章图像构建为第一标准印章集合;第二匹配单元用于将上述目标文字特征向量和上述第一标准印章集合中的各上述标准印章图像对应的上述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将上述第二相似度结果在第二相似度范围内的上述标准印章图像构建为第二标准印章集合;确定单元用于在上述第二标准印章集合不为空的情况下,确定上述待检测印章为真印章,在上述第二标准印章集合为空的情况下,确定上述待检测印章为假印章。通过结合图像的粗特征匹配结果和文本区域的精特征匹配结果,级联判定印章的真伪情况。这样不仅考虑了完整印章的结构和组成特点,而且也考虑到了最关键的文本区域特征,解决了现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。
178.以上所述仅为本技术的优选实施例而已,并不用于限制本技术,对于本领域的技术人员来说,本技术可以有各种更改和变化。凡在本技术的精神和原则之内,所作的任何修改、等同替换、改进等,均应包含在本技术的保护范围之内。
技术特征:
1.一种印章真伪的鉴别方法,其特征在于,包括:获取待鉴别印章图像,并提取所述待鉴别印章图像中的目标图像特征向量和所述待鉴别印章图像中的目标文字特征向量,所述待鉴别印章图像为待检测印章的图像;获取多个标准印章图像,并提取各所述标准印章图像中的标准图像特征向量和各所述标准印章图像中的标准文字特征向量;将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将所述第一相似度结果在第一相似度范围内的所述标准印章图像构建为第一标准印章集合;将所述目标文字特征向量和所述第一标准印章集合中的各所述标准印章图像对应的所述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将所述第二相似度结果在第二相似度范围内的所述标准印章图像构建为第二标准印章集合;在所述第二标准印章集合不为空的情况下,确定所述待检测印章为真印章,在所述第二标准印章集合为空的情况下,确定所述待检测印章为假印章。2.根据权利要求1所述的鉴别方法,其特征在于,在将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果之前,所述方法还包括:获取所述标准印章图像的标准文字图像;采用二阶贝塞尔曲线获取所述待鉴别印章图像的目标文字图像;将所述目标文字图像和各所述标准文字图像进行相似度匹配,得到多个第三相似度结果,并且将所述第三相似度结果在第三相似度范围内的所述标准印章图像构建为第三标准印章集合。3.根据权利要求2所述的鉴别方法,其特征在于,采用二阶贝塞尔曲线获取所述待鉴别印章图像的目标文字图像,包括:基于贝塞尔系数拟合出所述待鉴别印章图像的初始文字图像,所述初始文字图像为圆环形图像;采用线性插值算法将所述初始文字图像转换为所述目标文字图像,所述目标文字图像为矩形图像。4.根据权利要求2所述的鉴别方法,其特征在于,将所述目标文字图像和各所述标准文字图像进行相似度匹配,得到多个第三相似度结果,包括:分别计算所述目标文字图像和各所述标准文字图像之间的编辑距离,得到多个所述编辑距离,其中,所述编辑距离的数值越大表示所述目标文字图像与所述标准文字图像的相似度越小,所述编辑距离的数值越小表示所述目标文字图像与所述标准文字图像的相似度越大;根据多个所述编辑距离,确定所述第三标准印章集合,其中,所述第三标准印章集合中的各所述标准印章图像和所述目标文字图像之间的所述编辑距离均在第一距离范围内,所述第三标准印章集合包括所述第一标准印章集合。5.根据权利要求4所述的鉴别方法,其特征在于,所述第三标准印章集合包括多个所述标准印章图像,将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,包括:分别计算所述目标图像特征向量和所述第三标准印章集合中的各所述标准印章图像
对应的所述标准图像特征向量之间的余弦距离,得到多个所述余弦距离;根据多个所述余弦距离,确定所述第一标准印章集合,所述第一标准印章集合中的各所述标准印章图像和所述目标图像特征向量的余弦距离均在第二距离范围内。6.根据权利要求1至5中任意一项所述的鉴别方法,其特征在于,提取所述待鉴别印章图像中的目标文字特征向量,包括:构建第一神经网络模型,其中,所述第一神经网络模型是采用三元组损失对多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的历史印章图像的历史目标文字图像以及与所述历史目标文字图像对应的历史文字特征向量,所述历史目标文字图像为包括目标文字的图像;根据所述第一神经网络模型和所述待鉴别印章图像,确定所述目标文字特征向量。7.根据权利要求1至5中任意一项所述的鉴别方法,其特征在于,提取所述待鉴别印章图像中的目标图像特征向量,包括:构建第二神经网络模型,其中,所述第二神经网络模型是采用三元组损失对多组训练数据训练得到的,所述多组训练数据中的每一组训练数据均包括历史时间段内获取的:历史印章图像以及与所述印章图像对应的历史图像特征向量;根据所述第二神经网络模型和所述待鉴别印章图像,确定所述目标图像特征向量。8.一种印章真伪的鉴别装置,其特征在于,包括:第一获取单元,用于获取待鉴别印章图像,并提取所述待鉴别印章图像中的目标图像特征向量和所述待鉴别印章图像中的目标文字特征向量,所述待鉴别印章图像为待检测印章的图像;第二获取单元,用于获取多个标准印章图像,并提取各所述标准印章图像中的标准图像特征向量和各所述标准印章图像中的标准文字特征向量;第一匹配单元,用于将所述目标图像特征向量和各所述标准图像特征向量进行相似度匹配,得到多个第一相似度结果,并且将所述第一相似度结果在第一相似度范围内的所述标准印章图像构建为第一标准印章集合;第二匹配单元,用于将所述目标文字特征向量和所述第一标准印章集合中的各所述标准印章图像对应的所述标准文字特征向量进行相似度匹配,得到多个第二相似度结果,并且将所述第二相似度结果在第二相似度范围内的所述标准印章图像构建为第二标准印章集合;确定单元,用于在所述第二标准印章集合不为空的情况下,确定所述待检测印章为真印章,在所述第二标准印章集合为空的情况下,确定所述待检测印章为假印章。9.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质包括存储的程序,其中,在所述程序运行时控制所述计算机可读存储介质所在设备执行权利要求1至7中任意一项所述的印章真伪的鉴别方法。10.一种电子设备,其特征在于,包括:一个或多个处理器,存储器,以及一个或多个程序,其中,所述一个或多个程序被存储在所述存储器中,并且被配置为由所述一个或多个处理器执行,所述一个或多个程序包括用于执行权利要求1至7中任意一项所述的印章真伪的鉴别方法。
技术总结
本申请提供了一种印章真伪的鉴别方法、鉴别装置、存储介质与电子设备,该方法包括:获取待鉴别印章图像,并提取目标图像特征向量和目标文字特征向量;获取多个标准印章图像,并提取标准图像特征向量和标准文字特征向量;将目标图像特征向量和各标准图像特征向量进行相似度匹配,得到第一标准印章集合;将目标文字特征向量和第一标准印章集合中的各标准印章图像对应的标准文字特征向量进行相似度匹配,得到第二标准印章集合;在第二标准印章集合不为空的情况下,确定待检测印章为真印章,在第二标准印章集合为空的情况下,确定待检测印章为假印章。解决了现有的印章真伪鉴别方式对印章的真伪鉴别不准确的问题。章的真伪鉴别不准确的问题。章的真伪鉴别不准确的问题。
技术研发人员:邓萍 朱峰 陆俊 陈嘉远 洪文焕 高丽伟 李浚昱
受保护的技术使用者:中国邮政储蓄银行股份有限公司
技术研发日:2023.04.20
技术公布日:2023/8/1
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/