异常数据告警方法、装置、计算机设备及存储介质与流程

未命名 09-29 阅读:100 评论:0


1.本发明涉及数据处理技术领域,尤其涉及一种异常数据告警方法、装置、计算机设备及存储介质。


背景技术:

2.勾稽关系指的是分散在各种材料中的财务和生产数据中有关数字之间存在的,可据以相互考察、核对的关系。因此在对企业进行核查时,需要对该企业的相关数据[如企业财务报表、erp(enterprise resource planning,企业资源计划)等财务软件、银行企业直连软件、税务企业直连软件、税务申报资料、mes(manufacturing execution system,制造执行系统)软件,海关申报资料、向证券监管机构申报的资料、向银行等部门申报的资料等]中的勾稽关系进行核查,以便通过数据之间的勾稽关系来识别数据的真实性,以及降低信息的不对称性。
[0003]
现有技术中,比如数据报表中的发票、海关、银行、关联方等数据之间的勾稽关系核查通常由核查人员手工完成,但是通过人工核查的方式会由于工作任务繁重,数据之间没有规律,导致核查效率低,且容易因疏忽而导致出错,进而导致核查准确率较低。


技术实现要素:

[0004]
本发明实施例提供一种异常数据告警方法、装置、计算机设备及存储介质,以解决现有技术中数据报表的勾稽关系核查效率较低以及准确率较低的问题。
[0005]
一种异常数据告警方法,包括:
[0006]
获取待审核数据,所述待审核数据包括待审核账户数据和图片扫描文档;
[0007]
对所述待审核账户数据进行账户网络构建,获取目标账户的账户关系网络;所述账户关系网络中包括至少一个关联账户;
[0008]
对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果;
[0009]
从第三方平台中获取所述目标账户对应的第三方相关文档,根据所述第三方相关文档和所述图片扫描文档生成目标账户文档;
[0010]
对所述目标账户文档进行实体抽取获取文档实体抽取结果,并基于所述文档实体抽取结果确定所述目标账户对应的文档告警结果;
[0011]
根据所述关联告警结果以及所述文档告警结果,确定所述目标账户对应的异常告警结果。
[0012]
一种异常数据告警装置,包括:
[0013]
数据获取模块,用于获取待审核数据,所述待审核数据包括待审核账户数据和图片扫描文档;
[0014]
关系网络构建模块,用于对所述待审核账户数据进行账户网络构建,获取目标账户的账户关系网络;所述账户关系网络中包括至少一个关联账户;
[0015]
关联告警模块,用于对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果;
[0016]
文档生成模块,用于从第三方平台中获取所述目标账户对应的第三方相关文档,根据所述第三方相关文档和所述图片扫描文档生成目标账户文档;
[0017]
文档告警模块,用于对所述目标账户文档进行实体抽取获取文档实体抽取结果,并基于所述文档实体抽取结果确定所述目标账户对应的文档告警结果;
[0018]
异常告警模块,用于根据所述关联告警结果以及所述文档告警结果,确定所述目标账户对应的异常告警结果。
[0019]
一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述异常数据告警方法。
[0020]
一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述异常数据告警方法。
[0021]
上述异常数据告警方法、装置、计算机设备及存储介质,该方法通过构建的账户关系网络能够查询到与目标账户所关联的所有关联账户,从而完成对目标账户和关联账户的账户名称以及账户资料的关联校验,得到关联告警结果,实现了目标账户和关联账户之间的勾稽关系上的核查;进一步地,还包括对目标账户对应的目标账户文档中的数据之间的勾稽关系进行核查得到文档告警结果,从而使得根据关联告警结果以及文档告警结果确定的异常告警结果具有多方数据的勾稽关系的核查,提高了对目标账户的数据进行勾稽关系核查的效率以及准确率。还极大减少了企业以虚假财务和生产数据骗取银行或者投资者等的资金,进一步减少了欺诈ipo(initial public offering,首次公开募股)上市等风险
附图说明
[0022]
为了更清楚地说明本发明实施例的技术方案,下面将对本发明实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0023]
图1是本发明一实施例中异常数据告警方法的一应用环境示意图;
[0024]
图2是本发明一实施例中异常数据告警方法的一流程图;
[0025]
图3是本发明一实施例中异常数据告警装置的一原理框图;
[0026]
图4是本发明一实施例中计算机设备的一示意图。
具体实施方式
[0027]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0028]
本发明实施例提供的异常数据告警方法,该异常数据告警方法可应用如图1所示的应用环境中。具体地,该异常数据告警方法应用在异常数据告警系统中,该异常数据告警系统包括如图1所示的客户端和服务器,客户端与服务器通过网络进行通信,用于解决现有
技术中财务报表的勾稽关系核查效率较低以及准确率较低的问题。其中,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
[0029]
在一实施例中,如图2所示,提供一种异常数据告警方法,以该方法应用在图1中的服务器为例进行说明,包括如下步骤:
[0030]
s10:获取目标账户的待审核数据,所述待审核数据包括待审核账户数据和图片扫描文档。
[0031]
可以理解地,目标账户即为待审核企业的账户。待审核数据为待审核企业提供的需要进行审核校验的数据。示例性地,假设在对企业的财务状况进行审核的应用场景下,待审核数据可以为该企业的财务报表或者资金流水单等。待审核数据包括待审核账户数据和图片扫描文档。其中,待审核账户数据中记载着与目标账户具有关联关系的其它账户的账户数据。示例性地,待审核账户数据可以为交易流水数据,在该交易流水数据中记载着与目标账户存在交易的其它账户的账户数据。图片扫描文档即为通过ocr(optical character recognition,光学字符识别)文本识别方法对文档图像进行文本识别得到的文档。文档图像是对目标账户的银行对账单进行拍摄得到的图像。
[0032]
s20:对所述待审核账户数据进行账户网络构建,获取目标账户的账户关系网络;所述账户关系网络中包括至少一个关联账户。
[0033]
可以理解地,待审核账户数据中记载着与目标账户具有关联关系的其它账户的账户数据,因此可以从待审核账户数据中挖掘出关联账户,从而根据挖掘到的关联账户构建目标账户的账户关系网络。示例性地,假设目标账户对应的待审核企业存在多个分公司,则关联账户可以为分公司的公司账户。关联账户还可以为目标账户对应的待审核企业的实际控股人或者董监高的个人账户。关联账户还可以为待审核企业的实际控股人的配偶或者父母的个人账户。
[0034]
在一实施例中,所述待审核账户数据包括多个账户关联数据;步骤s20中,也即对所述待审核账户数据进行账户网络构建,获取目标账户的账户关系网络,包括:
[0035]
(1)根据每一所述账户关联数据,获取每一所述账户关联数据对应的关联账户。
[0036]
可以理解地,在待审核账户数据中存在多个账户关联数据,该账户关联数据可以为交易流水数据、工商基础数据和人员属性数据。其中,交易流水数据即为表征目标账户与其它账户之间的交易记录的数据。示例性地,交易流水数据可以为目标账户与其它账户之间的交易付款记录或者交易转账记录。工商基础数据即为表征目标账户对应的待审核企业的工商信息的数据。示例性地,工商基础数据可以为目标账户对应的待审核企业的实际控股人的个人账户信息。人员属性数据即为与目标账户对应的待审核企业中的人员(人员可以为待审核企业的实际控股人或者董监高等)具有法律关系的人员的个人账户信息。示例性地,人员属性数据可以为目标账户对应的待审核企业的实际控股人的配偶的个人账户信息。
[0037]
进一步地,根据每一所述账户关联数据,获取每一所述账户关联数据对应的关联账户,包括:
[0038]
(11)根据银企数据库采集到的交易流水数据,获取所述交易流水数据对应的第一
账户。
[0039]
可以理解地,银企数据库可以为银企软件模块的数据库。若一个交易流水数据中为目标账户与一个其它账户之间的交易记录的数据,则将该其它账户确定为第一账户;若一个交易流水数据中为目标账户与多个其它账户之间的交易记录的数据,则将所有存在交易关联的其它账户确定为第一账户。示例性地,假设目标账户需要转账至其它账户c,但目标账户先将金额转账至其它账户a,再通过其它账户a转账至其它账户b,最后通过其它账户b转账至其它账户c,则其它账户a、其它账户b以及其它账户c均确定为第一账户。
[0040]
(12)根据工商数据库采集到的工商基础数据,获取所述工商基础数据对应的第二账户。
[0041]
可以理解地,工商数据库可以为登记企业工商信息的软件(如企查查软件)的数据库。工商基础数据可以为目标账户对应的待审核企业的实际控股人的个人账户信息,董监高的个人账户信息亦或者在职员工的社保公积金账户等。第二账户即可以为目标账户对应的待审核企业的实际控股人的个人账户、董监高的个人账户、在职员工的社保账户或者公积金账户等。
[0042]
(13)根据预设人员属性库中采集到的人员属性数据,获取所述人员属性数据对应的第三账户。
[0043]
可以理解地,预设人员属性库为目标账户所使用的社交平台亦或者相关部门的人员数据库。从预设人员属性库中挖掘出与目标账户具有法律关系的第三账户。示例性地,第三账户可以为目标账户对应的待审核企业的实际控股人的配偶的个人账户,或者实际控股人的父母的个人账户等。
[0044]
(14)将所述第一账户、所述第二账户和所述第三账户共同记录为所述关联账户。
[0045]
具体地,在获取所述交易流水数据对应的第一账户、获取所述工商基础数据对应的第二账户以及获取所述人员属性数据对应的第三账户之后,即可将第一账户、第二账户和第三账户共同确定为目标账户对应的关联账户。
[0046]
(2)分别确定所述目标账户与各所述关联账户之间的相关等级。
[0047]
(3)根据所述相关等级,确定所述目标账户与各所述关联账户对应的关系层级,并将各所述关联账户设置在所述关联账户对应的关系层级中。
[0048]
可以理解地,相关等级即表征关联账户与目标账户之间的关联关系的相关程度。相关等级包括直接关系等级和间接关系等级。一个关联账户属于一个关系层级,也即一个关系层级中包括至少一个关联账户。若在某个关系层级中不包括关联账户,则该关系层级会被删除。
[0049]
进一步地,直接关系等级的关联账户指的是与目标账户具有直接关联关系的关联账户。示例性地,直接关系等级的关联账户可以为目标账户对应的待审核企业的实际控股人的账户、在职员工的社保账户或者公积金账户。从而可以将与目标账户具有直接关系的关联账户,也即相关等级为直接关系等级的关联账户设置在第一关系层级。
[0050]
进一步地,间接关系等级中包括第一间接关系等级,该第一间接关系等级指的是与第一关系层级的关联账户具有直接关联关系的关联账户。示例性地,假设第一关系层级中的一个关联账户为待审核企业的实际控股人的账户,则属于第一间接关系等级的关联账户可以为实际控股人的配偶的账户,或者与该实际控股人存在转账交易关系的账户。从而
将与第一关系层级的关联账户存在直接关联关系的关联账户,也即与第一关系层级的关联账户之间的相关等级为直接关系等级,与目标账户之间的相关等级为第一间接关系等级的关联账户设置在第二关系层级。
[0051]
进一步地,间接关系等级中还可以包括第二间接关系等级(如与第二关系层级的关联账户之间具有直接关联关系的关联账户,可以设置在第三关系层级)、第三间接关系等级或者第四间接关系等级等。可以理解地,每一个间接关系等级的关联账户与在其前一个的间接关系等级的关联账户之间为直接关联等级(如第二间接关系等级与第一间接关系等级之间),且间接关系等级越大,关联账户与目标账户之间的关联关系越小。例如第二间接关系等级大于第一间接关系等级,但处于第二间接关系等级对应的关系层级上的关联账户与目标账户之间的关联关系,小于处于第一间接关系等级对应的关系层级上的关联账户与目标账户之间的关联关系。
[0052]
(4)在所有所述关联账户均设置在所述关联账户对应的关系层级之后,获取所述目标账户的账户关系网络构建完成。
[0053]
具体地,在根据所述相关等级,确定所述目标账户与各所述关联账户对应的关系层级,并将各所述关联账户设置在所述关联账户对应的关系层级中之后,若所有关联账户均设置在与其对应的关系层级之后,确定目标账户的账户关系网络构建完成。
[0054]
s30:对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果。
[0055]
可以理解地,由于现有技术中针对一个企业进行审查时,并未对该企业下的数据进行勾稽,且企业的数据可能存在造假风险,因此可以基于目标账户以及关联账户进行关联校验,从而确定目标账户以及关联账户是否真实存在,以及目标账户和关联账户的企业资料等是否真实,进而确定目标账户对应的关联告警结果。其中,关联告警结果中包括目标账户或者关联账户存在异常的数据。
[0056]
在一实施例中,所述待审核数据还包括所述目标账户对应的待审核企业资料;步骤s30中,也即对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果,包括:
[0057]
(1)基于所述目标账户对应的待审核账户数据和所述账户关系网络,确定所述目标账户对应的账户校验结果。
[0058]
具体地,在获取目标账户的账户关系网络之后,从账户关系网络中提取目标账户与关联账户之间的关联关系,并根据待审核账户数据中目标账户与关联账户之间的关联记录,以及从第三方平台中获取到银行结算账户清单。将目标账户以及关联账户与银行结算账户清单中的所有银行结算账户进行匹配,从而确定在银行结算账户清单中是否完全包含目标账户以及所有的关联账户,并且可以从银行结算账户清单中确定目标账户与关联账户之间的关联关系,从而得到账户校验结果。其中,账户校验结果包括校验成功结果以及校验失败结果。校验成功结果即为指示目标账户与关联账户在银行结算账户清单中存在,且目标账户与关联账户之间的关联关系与账户关系网络中该关联账户对应的关系层级完全匹配。校验失败结果即为指示关联账户不在银行结算账户清单中,或者目标账户与关联账户之间的关联关系与账户关系网络中该关联账户对应的关系层级不匹配。
[0059]
进一步地,在账户关系网络的构建过程中,为每一关联账户均设置了相对应的关
系层级,该关系层级表征了目标账户与每一个关联账户之间关联程度。因此,从银行结算账户清单中确定目标账户与关联账户之间的关联关系之后,可以将该关联关系与关联账户对应的关系层级进行比较。在本实施例中,设定预设层级阈值(该预设层级阈值可以设定为3或者4等,3表征第三关系层级,4表征第四关系层级)。当关系层级小于或等于预设层级阈值时,银行结算账户清单中确定目标账户与关联账户之间的关联关系,需要与该关联账户对应的关系层级相同,该关联账户与目标账户对应的账户校验结果为校验成功结果。当关系层级大于预设层级阈值时,银行结算账户清单中确定目标账户与关联账户之间的关联关系,可以允许与该关联账户对应的关系层级存在误差(如相差一个关系层级)。
[0060]
(2)从第三方平台,获取所述目标账户对应的预设比对资料和所述关联账户对应的关联账户资料。
[0061]
可以理解地,待审核企业资料是指目标账户对应的资料,该待审核企业资料可以为企业自述书或者企业的招股说明书等。预设比对资料是指从最末级的科目余额表或者第三方机构获取到该目标账户对应的企业所具有的资质资料以及知识产权资料。关联账户资料是指关联账户对应的企业资料,例如该关联账户资料为与目标账户对应的供应商的企业资料。
[0062]
(3)根据所述预设比对资料和所述关联账户资料对所述待审核企业资料进行校验,确定所述目标账户对应的资料校验结果。
[0063]
可以理解地,上述说明中指出待审核企业资料为目标账户对应的企业自述书或者招股说明书,因此待审核企业资料可能会存在造假或者撰写错误的问题,进而可以通过预设比对资料以及关联账户资料对待审核企业资料进行校验。例如对预设比对资料以及关联账户资料进行标题识别,确定预设比对资料或者关联账户资料中的资料主题,从而在待审核企业资料查询到对应的资料主题位置,并将预设比对资料和关联账户资料,与待审核企业资料中的对应位置的区域资料进行文本比对,完成对待审核企业资料的校验过程,进而得到与目标账户对应的资料校验结果。其中,资料校验结果包括校验失败结果以及校验成功结果。校验失败结果指示待审核企业资料中的区域资料与预设比对资料和/或关联账户资料不匹配。校验失败成功结果指示待审核企业资料中的区域资料与预设比对资料和/或关联账户资料匹配。
[0064]
(4)根据所述账户校验结果和所述资料校验结果,确定所述关联告警结果。
[0065]
具体地,在确定与目标账户对应的账户校验结果以及资料校验结果之后,此时即通过账户名称、银行结算账户清单、预设比对资料、关联账户资料以及待审核企业资料,对目标账户以及关联账户进行初步筛选,形成了不同账户以及企业资料之间的数据勾稽,进而将账户校验结果以及资料校验结果整合得到关联告警结果。关联告警结果即为从不同账户以及企业资料两个方向进行异常数据告警得到结果。由于形成了不同账户以及企业资料之间的数据勾稽,提高了异常数据告警的准确率,从而提高了企业核查的准确率以及效率。
[0066]
s40:从第三方平台中获取所述目标账户对应的第三方相关文档,根据所述第三方相关文档和所述图片扫描文档生成目标账户文档。
[0067]
可以理解地,第三方平台可以为如银企软件模块或者电子银行模块等平台。第三方相关文档即为企业在第三方平台上的数据(如资金转账数据等)。
[0068]
可以理解地,由于图片扫描文档是通过ocr文本识别技术对文档图像进行文本识
别得到的。但是图片扫描文档会受到文档图像的影响,而文档图像是对纸质文档进行拍照得到的,因此图片扫描文档的完整性与纸质文档的完整性相关。例如在纸质文档存在遮挡、破损亦或者模糊等情况时,图片扫描文档也会相应存在遮挡、破损亦或者模糊的数据。为了保证异常数据告警的准确率,需要对图片扫描文档进行数据完整性校验,该数据完整性校验用于剔除图片扫描文档中存在的被遮挡、破损亦或者模糊的残缺数据。在剔除图片扫描文档中的残缺数据后,将剔除残缺数据的图片扫描文档和第三方相关文档进行整合,从而得到目标账户文档。其中,目标账户文档可以为目标账户的财务账单数据或者资金流水单数据等。
[0069]
在一实施例中,所述图片扫描文档中包括至少一个区域扫描文档;步骤s40中,也即根据所述第三方相关文档和所述图片扫描文档生成目标账户文档,包括:
[0070]
(1)将所述区域扫描文档输入至预设实体识别模型中,确定所述区域扫描文档中的实体识别结果;一个所述区域扫描文档对应一个所述实体识别结果。
[0071]
可以理解地,上述说明中指出在通过ocr文本识别方法对文档图像进行文本识别时,会对文档图像进行区域划分,也即将文档图像中每一行文本划分为一个区域扫描文档,且文档图像是对纸质文档进行拍摄得到的,因此一个区域扫描文档即对应纸质文档中的一行文档。预设实体识别模型可以通过大量训练数据,以半监督、无监督、有监督等形式对基于神经网络构建的基础模型进行训练得到。实体识别结果即为对一个区域扫描文档内的所有文字内容进行实体识别后得到的结果,也即在区域扫描文档内的每一个/每一组文字均会进行实体识别,使得一个区域扫描文档中可能存在多个实体。示例性地,文档图像可以对企业的银行对账单进行拍摄得到时,该区域扫描文档中可以包括转入/转出的金额对应的实体,日期对应的实体或者账户余额对应的实体等。
[0072]
(2)对所有所述实体识别结果进行实体筛选,获取筛选实体结果。
[0073]
可以理解地,一般的银行对账单中账户金额明细下每一行数据的排序方式都是相同的,例如假设第一个位置是日期实体,则每一个区域扫描文档中第一个位置的实体识别结果均为日期实体。因此本实施例中提出通过基于实体位置进行实体角度校验的方式,对实体识别结果进行实体筛选,从而从所有实体识别结果中筛选出筛选实体结果。其中,基于实体位置进行实体角度校验的方式即为,通过基于第一个区域扫描文档中实体所在位置判断下一个区域扫描文档中同类型实体是否近似在同一曲线上。上述说明指出一般的银行对账单中账户金额明细下每一行数据的排序方式都是相同的,因此若下一个区域扫描文档中不存在该同类型实体,或者该同类型实体的实体位置不正确(不正确是指与第一个区域扫描文档中同类型实体不近似处于同一条曲线上)。如第一个区域扫描文档中日期实体所在位置为第一个位置,而下一个相邻的区域扫描文档中日期实体所在位置为第三个位置时,此时认为这两个区域扫描文档中存在一个错误的区域扫描文档。通过上述基于实体位置进行实体校验的方式完成对所有的区域扫描文档的实体识别结果进行实体筛选之后,即可得到筛选实体结果,也即该筛选实体结果中的每一类型的实体均排序相同,从而可以剔除文档图像中的纸质文档存在模糊或者损坏等原因对应的实体识别结果,提高目标账户文档生成的准确性。
[0074]
具体地,在将所述区域扫描文档输入至预设实体识别模型中,以确定所述区域扫描文档中的实体识别结果之后,从第一个文档实体(也即第一列数据对应的实体)开始,此
时可以将排序在最顶层的区域扫描文档的文档实体添加至第一组实体结果中,并选取排序在最顶层的区域扫描文档的下一层级的区域扫描文档的第一个文档实体,并基于最顶层的区域扫描文档的第一个文档实体对应的第一坐标信息,以及排序在最顶层的区域扫描文档的下一层级的区域扫描文档的第一个文档实体的第二坐标信息进行角度校验。例如将第一坐标信息减去第二坐标信息得到坐标向量(也即将第一坐标信息的纵坐标减去第二坐标信息的纵坐标得到坐标向量的纵坐标信息,将第一坐标信息的横坐标减去第二坐标信息的横坐标即得到坐标向量的横坐标信息),确定坐标向量与标准横轴向量(该标准横轴可以为文档图像对应的纸质文档中的横轴,该标准横轴的纵坐标为0)之间的向量角度,并将该向量角度和第一预设角度阈值(第一预设角度阈值可以选取较小于90
°
的角度值,如80
°
、85
°
)以及第二预设角度阈值(第二预设角度阈值可以选取较大于90
°
的角度值,如95
°
、100
°
)进行比较。当向量角度大于第一预设角度阈值,且小于第二预设角度阈值时,即可确定最顶层的区域扫描文档的第一个文档实体,和排序在最顶层的区域扫描文档的下一层级的区域扫描文档的第一个文档实体近似处于一条直线上,此时排序在最顶层的区域扫描文档的下一层级的区域扫描文档对应的实体识别结果可以确定为筛选实体结果。如此,根据上述的方法,可以循环的判定每一个区域扫描文档中的第一个文档实体是否近似处于同一条直线上,并在判断完第一个文档实体之后可以对第二个文档实体(也即排序在第二个位置的实体)进行筛选校验,如此,在完成对所有实体的校验之后,即可得到筛选实体结果。
[0075]
(3)根据所述筛选实体结果对应的区域扫描文档和所述第三方相关文档,生成所述目标账户文档。
[0076]
具体地,在对所有实体识别结果进行实体筛选,以从所有实体识别结果中筛选出筛选实体结果之后,由于筛选实体结果即为表征了与其对应的区域扫描文档中的所有数据均为准确,清晰,未被遮挡的数据,从而根据筛选实体结果对应的区域扫描文档以及第三方相关文档进行整合,生成目标账户文档。
[0077]
s50:对所述目标账户文档进行实体抽取获取文档实体抽取结果,并基于所述文档实体抽取结果确定所述目标账户对应的文档告警结果。
[0078]
可以理解地,实体抽取即为从目标账户文档中抽取需要抽取的实体对应的文字数据。文档实体抽取结果即为从目标账户文档中抽到的实体以及实体对应的数据,需要说明的是,实体即为一种标签,数据内容即为每个实体对应的实质内容。文档告警结果包含了目标账户文档中存在错误的数据。
[0079]
具体地,在根据第三方相关文档以及图片扫描文档生成目标账户文档之后,即可对目标账户文档进行实体抽取,也即抽取出目标账户文档中每一个目标文档数据,且该目标文档数据会对应一个数据实体类别,从而得到目标账户文档对应的文档实体抽取结果,进而基于该文档实体抽取结果,对目标账户文档中的目标文档数据进行核查,得到与目标账户对应的文档告警结果。其中,文档告警结果包括校验失败结果以及校验成功结果。校验失败结果中指示目标账户文档中不准确或者错误的目标文档数据。校验成功结果中指示目标账户文档中准确的目标文档数据。
[0080]
s60:根据所述关联告警结果以及所述文档告警结果,确定所述目标账户对应的异常告警结果。
[0081]
可以理解地,在上述说明中指出关联告警结果中包括通过目标账户的名称、关联
账户的名称以及银行结算账户清单得到的账户校验结果,以及通过预设比对资料、关联账户资料以及待审核企业资料得到的资料校验结果,而文档告警结果即为对目标账户文档中所有数据进行校验得到的结果,也即关联告警结果从目标账户和关联账户的账户名称之间勾稽关系的核查,以及目标账户和关联账户的相关资料(如上述待审核企业资料、预设比对资料以及关联账户资料)之间勾稽关系的核查,文档告警结果从目标账户的目标账户文档中的内部数据之间的勾稽关系上的核查,进而将关联告警结果以及文档告警结果进行整合后,即可得到目标账户对应的异常告警结果。
[0082]
在本实施例中,通过构建的账户关系网络能够查询到与目标账户所关联的所有关联账户,从而完成对目标账户和关联账户的账户名称以及账户资料的关联校验,得到关联告警结果,实现了目标账户和关联账户之间的勾稽关系上的核查;进一步地,还包括对目标账户对应的目标账户文档中的数据之间的勾稽关系进行核查得到文档告警结果,从而使得根据关联告警结果以及文档告警结果确定的异常告警结果具有多方数据的勾稽关系的核查,提高了对目标账户的数据进行勾稽关系核查的效率以及准确率。
[0083]
在一实施例中,步骤s40中,也即所述对所述目标账户文档进行实体抽取,得到与所述目标账户文档对应的文档实体抽取结果,包括:
[0084]
对所述目标账户文档进行实体识别,确定所述目标账户文档中的目标实体组;一个所述目标实体组中包括一个目标告警实体。
[0085]
具体地,在生成目标账户文档之后,可以通过上述的预设实体识别模型对目标账户文档进行实体识别,从而确定目标账户文档中的目标实体组。可以理解地,与图片扫描文档类似,该目标账户文档可以视为一个表格,每一行的数据进行实体识别后对应一个目标实体组。目标告警实体可以为目标实体组中的任意一个实体,但是每一个目标实体组中的目标告警实体为同一个类型的实体,例如,当目标账户文档中记载的是企业的现金流时,该目标告警实体可以为余额实体。
[0086]
确定所有所述目标告警实体对应的目标实体曲线,并根据所述目标实体曲线确定各所述目标实体组对应的实体文本集合。
[0087]
可以理解地,目标实体曲线即为所有目标告警实体的连线,或者各目标告警实体一侧(如左侧或者右侧)坐标点的连线。一个实体文本集合与一个目标实体组对应,一个目标实体组中除目标告警实体之外还包括其它实体,因此实体文本集合即为与目标告警实体对应的文本内容,以及与除目标告警实体之外的其它实体的文本内容。
[0088]
具体地,在对目标账户文档进行实体识别,以确定目标账户文档中的目标实体组之后,获取各目标实体组中的目标告警实体的坐标信息,进而基于各目标告警实体的坐标信息拟合出一条连通所有目标告警实体的曲线,即为目标实体曲线,且该目标实体曲线趋近于一条直线。在确定目标实体曲线之后,即可通过左右方位平移的方式,将该目标实体曲线平移至其它实体的左侧,以及复制目标实体曲线并将复制得到的目标实体曲线平移至其它实体的右侧,也即此时通过两条目标实体曲线将各实体框住,从而提取这两条目标实体曲线之间文本内容。通过各目标实体组的横坐标信息(由于一行文本为一各目标实体组,因此不同的目标实体组的横坐标信息是不同的,但是纵坐标信息可能相同,如同一列的数据时横坐标信息不同,但纵坐标信息相同)确定与各目标实体组中每一实体对应的具体文本内容,进而生成与各目标实体组对应的实体文本集合。
[0089]
根据所述目标告警实体以及与其对应的实体文本集合,生成所述文档实体抽取结果。
[0090]
具体地,在确定与所有所述目标告警实体对应的目标实体曲线,并根据所述目标实体曲线确定与各所述目标实体组对应的实体文本集合之后,即可根据目标告警实体抽取出与其对应的文本内容,以及抽取出与除目标告警实体之外的其它实体的文本内容,也即实体文本集合的文本内容,进而根据抽取的文本内容生成与目标账户文档对应的文档实体抽取结果,也即将实体与文本内容一一对应。
[0091]
在一实施例中,所述文档实体抽取结果中包括至少一个目标文档数据,且一个所述目标文档数据关联一个数据实体类别;
[0092]
所述基于所述文档实体抽取结果确定与所述目标账户对应的文档告警结果,包括:
[0093]
根据所述目标文档数据以及所述数据实体类别,确定与各所述目标文档数据对应的数据类型标签。
[0094]
可以理解地,在上述说明中在对企业的报表数据进行核查的场景下,目标账户文档为目标账户的资金流水单,该目标账户文档可以视为一种表格,因此该目标账户文档中存在多个目标文档数据,且每一个目标文档数据对应一个数据实体类别,示例性地,余额实体类别、转账实体(如表征转入还是转出)等。因此,在对目标账户文档进行实体抽取之后,即可确定目标账户文档中目标文档数据以及与目标文档数据对应的数据实体类别,从而可以基于目标文档数据以及数据实体类别,确定与各目标文档数据对应的数据类型标签。其中,数据类型标签可以包括如数值型数据、分布型数据、离散型数据等;示例性地,余额数据以及余额实体,即可确定该余额数据对应的数据类型标签为数值型数据;日期数据以及日期实体,即可确定该日期数据对应的数据类型标签为分布型数据;转账数据(该转账数据表示转出或者转入类型)以及转账实体,则可确定转账数据对应的数据类型标签可以为分类型数据。
[0095]
获取所述数据类型标签对应的数据校验规则,基于所述数据校验规则生成数据告警校验脚本。
[0096]
可以理解地,数据校验规则为用于对目标文档数据进行核查的规则。示例性地,假设数据类型标签为数值型数据时,该数据校验规则可以为从所有目标文档数据中查询到转账金额较大(可以设定一个数值阈值,如十万,从而将超过该数值阈值的目标文档数据视为较大的转账金额)的数据。或者通过将多个数据之间的关联关系进行整合,如对相关联的数据进行逻辑运算,从而将运算得到的结果与设定的阈值进行比较。假设数据类型标签为分类型数据时,通过统计账户之间的转账交互次数并标记出转账交互次数大于设定阈值的账户。
[0097]
具体地,在根据目标文档数据以及数据实体类别,确定与各目标文档数据对应的数据类型标签之后,即可获取与数据类型标签对应的数据校验规则,并根据数据校验规则生成数据告警校验脚本。
[0098]
示例性地,目标账户文档中包括目标账户的公账和私账相互转账的目标文档数据,进而可以对金额大、频繁发生的目标文档数据进行标记,从而得到与公账和私账相互转账的目标文档数据对应的告警配置信息,也即该告警配置信息为查询公账和私账相互转账
的目标文档数据是否超过设定金额阈值(用于判定金额大小关系,超过设定金额阈值则认为该项数据金额大,存在异常);告警配置信息还可以为对金额进行分类。例如超过或等于设定金额阈值的公账和私账对应的目标文档数据分为高金额类;未超过设定金额阈值的公账和私账对应的目标文档数据分为低金额类。还可以在高金额类中确定目标账户向每一关联账户进行转账的次数。将转账次数高于或等于设定阈值的目标文档数据分为高金额高频率类,将转账次数低于设定阈值的目标文档数据分为高金额低频率类。从而可以从高金额高频率类中挖掘出与目标账户之间频繁发生大金额交易的关联账户,该关联账户被视为可能存在异常的账户。
[0099]
又一示例的,还可以将目标账户文档中所有转账金额(包括转出金额以及转入金额)对应的目标文档数据进行逻辑运算,从而将逻辑运算得到的汇总数与科目余额表中的其他应收和其他应付的备用金本年累计发生额进行比较,此时该告警配置信息即为确定目标账户文档中所有转账金额对应的目标文档数据对应的位置,进而将这些位置下的所有目标文档数据进行和计算得到汇总数,并获取科目余额表中的其他应收和其他应付的备用金本年累计发生额,从而将汇总数和累计发生额进行比较,若汇总数和累计发生额不相等,则该目标账户文档中的转账金额存在异常。
[0100]
执行所述数据告警校验脚本,对所述目标文档数据进行告警校验处理,获取数据告警结果。
[0101]
可以理解地,在所有目标文档数据均进行数据告警配置完毕之后,也即生成与目标文档数据对应的告警配置信息之后,根据告警配置信息生成数据告警校验脚本,并通过服务器中配置的监控系统识别出告警校验脚本,并对目标文档数据进行基于对应的数据校验规则的监控过程。其中,告警校验脚本即为监控系统可以识别的符合逻辑的可执行程序。其中,数据告警结果包括表征目标文档数据存在异常的结果,以及目标文档数据不存在异常的结果。
[0102]
根据所有所述目标文档数据对应的数据告警结果,确定所述文档告警结果。
[0103]
可以理解地,文档告警结果包含了目标账户文档中的所有存在异常的目标文档数据,因此在确定与各目标文档数据对应的数据告警结果之后,即可根据表征目标文档数据存在异常的数据告警结果进行整合,从而得到文档告警结果。
[0104]
在一实施例中,所述执行所述数据告警校验脚本,对所述目标文档数据进行告警校验处理,得到与所述目标文档数据对应的数据告警结果,包括:
[0105]
根据所述数据告警校验脚本,执行以下至少一个处理逻辑:
[0106]
若所述目标文档数据包括供应链数据,则从第三方平台,获取与所述供应链数据相对应的上下游关联数据,根据所述供应链数据和所述上下游关联数据,获取数据告警结果。
[0107]
可以理解地,假设目标账户对应的待审核企业为生产型企业,该待审核企业存在关联的上游企业可以为原材料供应商,该待审核企业存在关联的下游企业可以为产品经销商。供应链数据为待审核企业记载的数据,供应链数据可以包括销售至每一经销商的产品数量以及金额,以及从供应商购买的原材料数量以及金额等。上下游关联数据包括上游数据以及下游数据。上游关联数据可以为原材料供应商向待审核企业提供的原材料数据(如提供的原材料的类型、数量和金额等)。下游关联数据可以为产品经销商从待审核企业购买
的产品数据(如购买的产品数量以及花费金额)。
[0108]
因此,目标文档数据中包括供应链数据时,可以从第三方平台(如原材料供应商的材料销售平台、产品经销商的产品购买记录凭条),获取供应链数据对应的上下游关联数据。从而根据上游关联数据和下游关联数据,对供应链数据进行校验。也即确定供应链数据是否与上游关联数据和下游关联数据匹配,从而得到数据告警结果。此时,该数据告警结果中包括匹配成功结果以及匹配失败结果。匹配成功结果指示与上下游关联数据相同的供应链数据。匹配失败结果指示与上下游关联数据不相同的供应链数据,该供应链数据即为需要进行告警标记的数据。
[0109]
若所述目标文档数据包括基于目标设备形成的设备清单数据,则从第三方平台,获取与所述设备清单数据相对应的设备底层数据,基于所述设备清单数据和所述设备底层数据,获取数据告警结果。
[0110]
可以理解地,设备清单数据为目标账户对应的待审核企业提供的目标设备的数据。目标设备为待审核企业中记载交易记录的设备。示例性地,假设待审核企业为一家奶茶店,则该设备清单数据为该奶茶店中的点单设备(即为目标设备)记录的数据(如一天内的点单数据)。设备底层数据为待审核企业的目标设备的底层数据,该设备底层数据是待审核企业无法触及或者更改的数据。
[0111]
因此,在目标文档数据中包括基于目标设备形成的设备清单数据,则从第三方平台(如目标设备的生产商),获取与设备清单数据相对应的设备底层数据,如根据设备清单数据对应的时间,从第三方平台中获取到相应的时间下的设备底层数据。进而将设备清单数据与设备底层数据进行匹配,得到数据告警结果。可以理解地,由于设备清单数据中可能存在造假的数据(如待审核企业制造多个交易记录,但该交易记录的对象为待审核企业的员工),进而可以通过待审核企业无法触及或者更改的设备底层数据对设备清单数据进行校验,提高数据校验的准确率。此时,该数据告警结果中包括匹配成功结果以及匹配失败结果。匹配成功结果指示与设备底层数据相同的设备清单数据。匹配失败结果指示与设备底层数据不相同的设备清单数据,该设备清单数据即为需要进行告警标记的数据。
[0112]
若所述目标文档数据包括生产能耗数据,则从第三方平台,获取与所述生产能耗数据相对应的能耗统计数据,基于所述生产能耗数据和所述能耗统计数据,获取数据告警结果。
[0113]
可以理解地,假设目标账户对应的待审核企业为生产型企业,该待审核企业在生产过程中需要消耗能源,例如水和电。因此,生产能耗数据即为待审核企业在生产过程中所消耗的能源,且该生产能耗数据是待审核企业自主填报的数据,可能存在造假的风险。第三方平台可以为能耗营业厅的能耗统计系统。能耗统计数据可以为待审核企业在预设时间范围内(如一个月)的能耗总量。
[0114]
具体地,在目标文档数据中包括生产能耗数据时,首先确定该生产能耗数据对应的统计时间范围。从第三方平台中获取与该统计时间范围对应的能耗统计数据,并将生产能耗数据与能耗统计数据进行对比。若生产能耗数据和能耗统计数据相同,则确定与该生产能耗数据对应的数据告警结果为比对成功结果;若生产能耗数据和能耗统计数据不相同,则确定与该生产能耗数据对应的数据告警结果为比对失败结果,该生产能耗数据即为需要进行告警标记的数据。
[0115]
若所述目标文档数据包括目标产品的产品生产数据,则获取与所述产品生产数据相对应的产品原料数据,基于所述产品生产数据和产品原料数据,获取数据告警结果。
[0116]
可以理解地,假设目标账户对应的待审核企业为生产型企业,同类型的产品对应需要消耗的原材料是相同的。因此在目标文档数据包括目标产品的产品生产数据(该产品生产数据即为目标产品生成的数量)时,可以根据该产品生产数据确定待审核企业所需要消耗的原材料的数量。从而从待审核企业的获取与产品生产数据对应的产品原料数据,该产品原料数据即为待审核企业购入的原材料数量。进而将根据产品生产数据确定待审核企业所需要消耗的原材料的数量,与产品原料数据进行比对,得到数据告警结果。若待审核企业所需要消耗的原材料的数量与产品原料数据相同,则确认数据告警结果为比对成功结果。若待审核企业所需要消耗的原材料的数量与产品原料数据不同,则确认数据告警结果为比对失败结果,该产品生产数据即为需要进行告警标记的数据。
[0117]
若所述目标文档数据包括待审核税务数据,则从第三方平台,获取与所述待审核税务数据相对应的目标缴纳税务数据,基于所述待审核税务数据以及所述目标缴纳税务数据,获取数据告警结果。
[0118]
可以理解地,待审核税务数据是指目标账户对应的待审核企业的税务数据。例如增值税数据。目标缴纳税务数据是指目标账户对应的待审核企业在一定时间范围内需要缴纳的税务数据。
[0119]
具体地,若目标文档数据包括待审核税务数据,则可以从第三方平台(如企查查平台),获取到目标账户对应的待审核企业的年度报告,并从该年度报告中提取产品利润数据。根据产品利润数据确定与产品利润数据相对应的税率值,从而根据产品利润数据以及税率值确定目标缴纳税务数据,并将目标缴纳税务数据与待审核税务数据进行比较,得到数据告警结果。若目标缴纳税务数据与待审核税务数据不同,则确定数据告警结果为比对失败结果,该待审核税务数据即为需要进行告警标记的数据。若目标缴纳税务数据与待审核税务数据相同,则确定数据告警结果为比对成功结果。
[0120]
若所述目标文档数据包括产品出口数据,则从第三方平台,获取与所述目标账户相对应的企业海关数据,基于所产品出口数据以及所述企业海关,获取数据告警结果。
[0121]
可以理解地,产品出口数据可以为目标账户对应的待审核企业的报表出口金额、报表出口产品数量或者报表出口产品类型等数据。企业海关数据为海关记录平台上记载的与待审核企业对应的出口数据。企业海关数据可以包括待审核企业的实际出口金额、实际出口产品数量或者实际出口产品类型等数据。
[0122]
具体地,若目标文档数据包括产品出口数据,则从第三方平台(如待审核企业所处位置对应的当地海关记录平台),获取与产品出口数据相对应的企业海关数据。进而将企业海关数据中的实际出口金额与产品出口数据中的报表出口金额进行比对,或者将企业海关数据中的实际出口产品数量以及实际出口产品类型,与产品出口数据中的报表出口产品数量以及报表出口产品类型进行比对,得到数据告警结果。例如,将实际出口金额与报表出口金额进行比对,确定报表出口金额是否出现造假的情况。若实际出口金额与报表出口金额不相同,确定数据告警结果为比对失败结果,该产品出口数据即为需要进行告警标记的数据。若实际出口金额与报表出口金额相同,确定数据告警结果为比对成功结果。
[0123]
若所述目标文档数据包括目标产品的产品销售数据,则从第三方平台,获取与所
述目标产品对应的销售比对数据,基于所述销售比对数据以及所述产品销售数据,获取数据告警结果。
[0124]
可以理解地,销售数据可以为目标账户对应的待审核企业所销售的目标产品的产品销售单价。销售比对数据为与待审核企业相同行业的其它企业所销售的,与目标产品相对应的同类型产品的产品销售单价。
[0125]
具体地,在目标文档数据包括目标产品的产品销售数据时,从第三方平台(如与待审核企业相同行业的其它企业的产品销售平台),获取与产品销售数据对应的销售比对数据。例如根据目标产品的产品标签(产品标签可以为目标产品的关键词),从第三方平台中获取到与目标产品相对应的同类型产品的产品销售单价,即为销售比对数据。将销售比对数据和产品销售数据之差确定为销售差价,并将销售差价与预设差值阈值(预设差值阈值可以根据目标产品对应调整,如设定为800,2000等)进行比较,得到数据告警结果。若销售差价大于或等于预设差值阈值,则确定数据告警结果为比较失败结果,该产品销售数据即为需要进行告警标记的数据。若销售差价小于预设差值阈值,则确定数据告警结果为比较成功结果。
[0126]
进一步地,针对上述的供应链数据、设备清单数据、生产能耗数据、产品生产数据、待审核税务数据、产品出口数据以及产品销售数据,这些数据均可以通过与其相对应的其它数据之间的比例关系来确定上述数据是否存在异常。例如通过确定目标缴纳税务数据与待审核税务数据之间的比例,再将该比例与目标缴纳税务数据对应的税率值进行比较,即可确定该待审核税务数据是否存在异常。因此,可以通过挖掘上述数据和与其所对应的其它数据(例如供应链数据对应于上下游关联数据)之间的比例关系。对每一组数据设定一个数据校验标签,并根据每一组数据对应的数据校验标签和比例关系训练一个预设比例关系模型(该预设比例关系模型可以基于神经网络结构进行构建)。如此即可将目标文档数据输入至训练得到的预设比例关系模型中,该预设比例关系模型对输入的目标文档数据进行数据识别,确定该目标文档数据对应的数据校验标签。从而根据数据校验标签确定比例关系,并根据该比例关系和目标文档数据确定对应的目标比例数值。进而将预设比例关系模型输出的目标比例数值和从第三方平台获取到的数据进行比较,确定数据告警结果。如此,将数据之间的勾稽关系嵌入预设比例关系模型的方式,提高了异常数据告警处理的效率以及准确率。
[0127]
应理解,上述实施例中各步骤的序号的大小并不意味着执行顺序的先后,各过程的执行顺序应以其功能和内在逻辑确定,而不应对本发明实施例的实施过程构成任何限定。
[0128]
在一实施例中,提供一种异常数据告警装置,该异常数据告警装置与上述实施例中异常数据告警方法一一对应。如图3所示,该异常数据告警装置包括关系网络获取模块10、关联告警模块20、文档生成模块30、文档告警模块40和异常告警模块50。各功能模块详细说明如下:
[0129]
数据获取模块10,用于获取目标账户的待审核数据,所述待审核数据包括待审核账户数据和图片扫描文档;
[0130]
关系网络获取模块20,用于对所述待审核账户数据进行账户网络构建,获取所述目标账户的账户关系网络;所述账户关系网络中包括至少一个关联账户;
[0131]
关联告警模块30,用于对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果;
[0132]
文档生成模块40,用于从第三方平台中获取所述目标账户对应的第三方相关文档,根据所述第三方相关文档和所述图片扫描文档生成目标账户文档;
[0133]
文档告警模块50,用于对所述目标账户文档进行实体抽取获取文档实体抽取结果,并基于所述文档实体抽取结果确定所述目标账户对应的文档告警结果;
[0134]
异常告警模块50,用于根据所述关联告警结果以及所述文档告警结果,确定所述目标账户对应的异常告警结果。
[0135]
优选地,异常数据告警装置还包括:
[0136]
关联账户获取模块,用于根据每一所述账户关联数据,获取每一所述账户关联数据对应的关联账户;
[0137]
相关等级确定模块,用于分别确定所述目标账户与各所述关联账户之间的相关等级;
[0138]
关系层级确定模块,用于根据所述相关等级,确定所述目标账户与各所述关联账户对应的关系层级,并将各所述关联账户设置在所述关联账户对应的关系层级中;
[0139]
关系网络构建模块,用于在所有所述关联账户均设置在所述关联账户对应的关系层级之后,获取所述目标账户的账户关系网络。
[0140]
优选地,所述账户关联数据包括交易流水数据、工商基础数据和人员属性数据;关联账户获取模块包括:
[0141]
第一账户获取单元,用于根据银企数据库采集到的交易流水数据,获取所述交易流水数据对应的第一账户;
[0142]
第二账户获取单元,用于根据工商数据库采集到的工商基础数据,获取所述工商基础数据对应的第二账户;
[0143]
第三账户获取单元,用于根据预设人员属性库中采集到的人员属性数据,获取所述人员属性数据对应的第三账户;
[0144]
关联账户获取单元,用于将所述第一账户、所述第二账户和所述第三账户共同记录为所述关联账户。
[0145]
优选地,所述待审核数据还包括所述目标账户对应的待审核企业资料;关联告警模块30包括:
[0146]
账户校验单元,用于基于所述目标账户对应的待审核账户数据和所述账户关系网络,确定所述目标账户对应的账户校验结果;
[0147]
资料获取单元,用于从第三方平台,获取所述目标账户对应的预设比对资料和所述关联账户对应的关联账户资料;
[0148]
资料校验单元,用于根据所述预设比对资料和所述关联账户资料对所述待审核企业资料进行校验,确定所述目标账户对应的资料校验结果;
[0149]
告警结果确定单元,用于根据所述账户校验结果和所述资料校验结果,确定所述关联告警结果。
[0150]
优选地,所述图片扫描文档中包括至少一个区域扫描文档;文档生成模块30,包括:
[0151]
实体识别单元,用于将所述区域扫描文档输入至预设实体识别模型中,确定所述区域扫描文档中的实体识别结果;一个所述区域扫描文档对应一个所述实体识别结果;
[0152]
实体筛选单元,用于对所有所述实体识别结果进行实体筛选,获取筛选实体结果;
[0153]
文档生成单元,用于根据所述筛选实体结果对应的区域扫描文档和所述第三方相关文档,生成所述目标账户文档。
[0154]
优选地,文档告警模块50包括:
[0155]
实体识别单元,用于对所述目标账户文档进行实体识别,确定所述目标账户文档中的目标实体组;一个所述目标实体组中包括一个目标告警实体;
[0156]
实体曲线确定单元,用于确定所有所述目标告警实体对应的目标实体曲线,并根据所述目标实体曲线确定各所述目标实体组对应的实体文本集合;
[0157]
实体抽取单元,用于根据所述目标告警实体以及与其对应的实体文本集合,生成所述文档实体抽取结果。
[0158]
优选地,所述文档实体抽取结果中包括至少一个目标文档数据,且一个所述目标文档数据关联一个数据实体类别;
[0159]
优选地,所述文档告警模块40包括:
[0160]
标签生成单元,用于根据所述目标文档数据以及所述数据实体类别,确定各所述目标文档数据对应的数据类型标签;
[0161]
脚本生成单元,用于获取所述数据类型标签对应的数据校验规则,基于所述数据校验规则生成数据告警校验脚本;
[0162]
告警校验单元,用于执行所述数据告警校验脚本,对所述目标文档数据进行告警校验处理,获取数据告警结果;
[0163]
告警结果生成单元,用于根据所有所述目标文档数据对应的数据告警结果,确定所述文档告警结果。
[0164]
优选地,告警校验单元包括:
[0165]
告警校验子单元,用于根据所述数据告警校验脚本,执行以下至少一个处理逻辑:
[0166]
若所述目标文档数据包括供应链数据,则从第三方平台,获取与所述供应链数据相对应的上下游关联数据,根据所述供应链数据和所述上下游关联数据,获取数据告警结果;
[0167]
若所述目标文档数据包括基于目标设备形成的设备清单数据,则从第三方平台,获取与所述设备清单数据相对应的设备底层数据,基于所述设备清单数据和所述设备底层数据,获取数据告警结果;
[0168]
若所述目标文档数据包括生产能耗数据,则从第三方平台,获取与所述生产能耗数据相对应的能耗统计数据,基于所述生产能耗数据和所述能耗统计数据,获取数据告警结果;
[0169]
若所述目标文档数据包括目标产品的产品生产数据,则从第三方平台,获取与所述产品生产数据相对应的产品原料数据,基于所述产品生产数据和产品原料数据,获取数据告警结果。
[0170]
关于异常数据告警装置的具体限定可以参见上文中对于异常数据告警方法的限定,在此不再赘述。上述异常数据告警装置中的各个模块可全部或部分通过软件、硬件及其
组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
[0171]
在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图4所示。该计算机设备包括通过系统总线连接的处理器、存储器、网络接口和数据库。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储上述实施例中的异常数据告警方法中所使用到的数据。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种异常数据告警方法。
[0172]
在一个实施例中,提供了一种计算机设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述实施例中的异常数据告警方法。
[0173]
在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现上述实施例中的异常数据告警方法。
[0174]
本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本技术所提供的各实施例中所使用的对存储器、存储、数据库或其它介质的任何引用,均可包括非易失性和/或易失性存储器。非易失性存储器可包括只读存储器(rom)、可编程rom(prom)、电可编程rom(eprom)、电可擦除可编程rom(eeprom)或闪存。易失性存储器可包括随机存取存储器(ram)或者外部高速缓冲存储器。作为说明而非局限,ram以多种形式可得,诸如静态ram(sram)、动态ram(dram)、同步dram(sdram)、双数据率sdram(ddrsdram)、增强型sdram(esdram)、同步链路(synchlink)dram(sldram)、存储器总线(rambus)直接ram(rdram)、直接存储器总线动态ram(drdram)、以及存储器总线动态ram(rdram)等。
[0175]
所属领域的技术人员可以清楚地了解到,为了描述的方便和简洁,仅以上述各功能单元、模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能单元、模块完成,即将所述装置的内部结构划分成不同的功能单元或模块,以完成以上描述的全部或者部分功能。
[0176]
以上所述实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围,均应包含在本发明的保护范围之内。

技术特征:
1.一种异常数据告警方法,其特征在于,包括:获取目标账户的待审核数据,所述待审核数据包括待审核账户数据和图片扫描文档;对所述待审核账户数据进行账户网络构建,获取所述目标账户的账户关系网络;所述账户关系网络中包括至少一个关联账户;对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果;从第三方平台中获取所述目标账户对应的第三方相关文档,根据所述第三方相关文档和所述图片扫描文档生成目标账户文档;对所述目标账户文档进行实体抽取获取文档实体抽取结果,并基于所述文档实体抽取结果确定所述目标账户对应的文档告警结果;根据所述关联告警结果以及所述文档告警结果,确定所述目标账户对应的异常告警结果。2.如权利要求1所述的异常数据告警方法,其特征在于,所述待审核账户数据包括多个账户关联数据;所述对所述待审核账户数据进行账户网络构建,获取目标账户的账户关系网络,包括:根据每一所述账户关联数据,获取每一所述账户关联数据对应的关联账户;分别确定所述目标账户与各所述关联账户之间的相关等级;根据所述相关等级,确定所述目标账户与各所述关联账户对应的关系层级,并将各所述关联账户设置在所述关联账户对应的关系层级中;在所有所述关联账户均设置在所述关联账户对应的关系层级之后,获取所述目标账户的账户关系网络。3.如权利要求2所述的异常数据告警方法,其特征在于,所述账户关联数据包括交易流水数据、工商基础数据和人员属性数据;所述根据每一所述账户关联数据,获取每一所述账户关联数据对应的关联账户,包括:根据银企数据库采集到的交易流水数据,获取所述交易流水数据对应的第一账户;根据工商数据库采集到的工商基础数据,获取所述工商基础数据对应的第二账户;根据预设人员属性库中采集到的人员属性数据,获取所述人员属性数据对应的第三账户;将所述第一账户、所述第二账户和所述第三账户共同记录为所述关联账户。4.如权利要求1所述的异常数据告警方法,其特征在于,所述待审核数据还包括所述目标账户对应的待审核企业资料;所述对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果,包括:基于所述目标账户对应的待审核账户数据和所述账户关系网络,确定所述目标账户对应的账户校验结果;从第三方平台,获取所述目标账户对应的预设比对资料和所述关联账户对应的关联账户资料;根据所述预设比对资料和所述关联账户资料对所述待审核企业资料进行校验,确定所述目标账户对应的资料校验结果;
根据所述账户校验结果和所述资料校验结果,确定所述关联告警结果。5.如权利要求1所述的异常数据告警方法,其特征在于,所述图片扫描文档中包括至少一个区域扫描文档;所述根据所述第三方相关文档和所述图片扫描文档生成目标账户文档,包括:将所述区域扫描文档输入至预设实体识别模型中,确定所述区域扫描文档中的实体识别结果;一个所述区域扫描文档对应一个所述实体识别结果;对所有所述实体识别结果进行实体筛选,获取筛选实体结果;根据所述筛选实体结果对应的区域扫描文档和所述第三方相关文档,生成所述目标账户文档。6.如权利要求1的异常数据告警方法,其特征在于,所述对所述目标账户文档进行实体抽取获取文档实体抽取结果,包括:对所述目标账户文档进行实体识别,确定所述目标账户文档中的目标实体组;一个所述目标实体组中包括一个目标告警实体;确定所有所述目标告警实体对应的目标实体曲线,并根据所述目标实体曲线确定各所述目标实体组对应的实体文本集合;根据所述目标告警实体以及与其对应的实体文本集合,生成所述文档实体抽取结果。7.如权利要求1所述的异常数据告警方法,其特征在于,所述文档实体抽取结果中包括至少一个目标文档数据,且一个所述目标文档数据关联一个数据实体类别;所述基于所述文档实体抽取结果确定所述目标账户对应的文档告警结果,包括:根据所述目标文档数据以及所述数据实体类别,确定各所述目标文档数据对应的数据类型标签;获取所述数据类型标签对应的数据校验规则,基于所述数据校验规则生成数据告警校验脚本;执行所述数据告警校验脚本,对所述目标文档数据进行告警校验处理,获取数据告警结果;根据所有所述目标文档数据对应的数据告警结果,确定所述文档告警结果。8.如权利要求7所述的异常数据告警方法,其特征在于,所述执行所述数据告警校验脚本,对所述目标文档数据进行告警校验处理,得到与所述目标文档数据对应的数据告警结果,包括:根据所述数据告警校验脚本,执行以下至少一个处理逻辑:若所述目标文档数据包括供应链数据,则从第三方平台,获取与所述供应链数据相对应的上下游关联数据,根据所述供应链数据和所述上下游关联数据,获取数据告警结果;若所述目标文档数据包括基于目标设备形成的设备清单数据,则从第三方平台,获取与所述设备清单数据相对应的设备底层数据,基于所述设备清单数据和所述设备底层数据,获取数据告警结果;若所述目标文档数据包括生产能耗数据,则从第三方平台,获取与所述生产能耗数据相对应的能耗统计数据,基于所述生产能耗数据和所述能耗统计数据,获取数据告警结果;若所述目标文档数据包括目标产品的产品生产数据,则获取与所述产品生产数据相对应的产品原料数据,基于所述产品生产数据和产品原料数据,获取数据告警结果;
若所述目标文档数据包括待审核税务数据,则从第三方平台,获取与所述待审核税务数据相对应的目标缴纳税务数据,基于所述待审核税务数据以及所述目标缴纳税务数据,获取数据告警结果;若所述目标文档数据包括产品出口数据,则从第三方平台,获取与所述目标账户相对应的企业海关数据,基于所产品出口数据以及所述企业海关,获取数据告警结果;若所述目标文档数据包括目标产品的产品销售数据,则从第三方平台,获取与所述目标产品对应的销售比对数据,基于所述销售比对数据以及所述产品销售数据,获取数据告警结果。9.一种异常数据告警装置,其特征在于,包括:数据获取模块,用于获取目标账户的待审核数据,所述待审核数据包括待审核账户数据和图片扫描文档;关系网络构建模块,用于对所述待审核账户数据进行账户网络构建,获取所述目标账户的账户关系网络;所述账户关系网络中包括至少一个关联账户;关联告警模块,用于对所述目标账户以及所述关联账户进行关联校验,确定所述目标账户对应的关联告警结果;文档生成模块,用于从第三方平台中获取所述目标账户对应的第三方相关文档,根据所述第三方相关文档和所述图片扫描文档生成目标账户文档;文档告警模块,用于对所述目标账户文档进行实体抽取获取文档实体抽取结果,并基于所述文档实体抽取结果确定所述目标账户对应的文档告警结果;异常告警模块,用于根据所述关联告警结果以及所述文档告警结果,确定所述目标账户对应的异常告警结果。10.一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现如权利要求1至8任一项所述异常数据告警方法。11.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至8任一项所述异常数据告警方法。

技术总结
本发明公开了一种异常数据告警方法、装置、计算机设备及存储介质,该方法通过对目标账户以及关联账户进行关联校验,确定与目标账户对应的关联告警结果;获取图片扫描文档,以及自预设第三方平台中获取与目标账户对应的第三方相关文档,根据第三方相关文档以及图片扫描文档生成目标账户文档;对目标账户文档进行实体抽取,得到文档实体抽取结果,并基于文档实体抽取结果确定与目标账户对应的文档告警结果;根据关联告警结果以及文档告警结果,确定与目标账户对应的异常告警结果。本发明提高了各种零散财务和生产等数据的勾稽关系核查效率以及准确率。查效率以及准确率。查效率以及准确率。


技术研发人员:朱芷叶 朱芮叶
受保护的技术使用者:朱芮叶
技术研发日:2022.04.29
技术公布日:2023/9/23
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐