基于健康医疗数据的安全管理系统、方法、电子设备和存储介质与流程
未命名
08-13
阅读:67
评论:0

1.本技术涉及数据管理技术领域,具体而言,本技术涉及一种基于健康医疗数据的安全管理系统、方法、电子设备和存储介质。
背景技术:
2.健康医疗数据作为健康医疗领域信息化发展中宝贵的数据资源,由于带有大量的业务属性,正在大数据的浪潮下被深度挖掘加工,创造出巨大的社会价值和经济价值。然而,随着健康医疗数据的巨大价值被开发,越来越多应用和服务被接入,这无形中给健康医疗数据的存储和访问带来安全隐患,例如:网络攻击、个人隐私泄漏等风险在此过程中此起彼伏。
3.健康医疗数据往往承载着个人信息,基于我国的《网络安全法》颁布,对于涉及个人信息安全的数据使用应当做到合规监管,以避免个人信息被不法利用,从而造成企业合规风险。
4.因此,如何加强健康医疗数据的安全保护,实行有效的安全管理,是开展健康医疗大数据业务过程中亟待解决的问题。
技术实现要素:
5.本技术各实施例提供了一种基于健康医疗数据的安全管理系统、方法、电子设备及存储介质,从而可以为健康医疗数据提供自动化的安全管理。技术方案如下:
6.根据本技术实施例的一个方面,提供了一种基于健康医疗数据的安全管理系统,包括:静态存储模块、应用服务模块以及数据安全管理模块;其中,静态存储模块,用于存储基于数据源采集的经过数据清洗的健康医疗数据;应用服务模块,用于基于健康医疗业务场景的应用和/或服务,提取静态存储模块的健康医疗数据,生成应用数据;数据安全管理模块,用于基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。
7.在一示例性实施方式中,数据安全管理模块包括:敏感数据挖掘组件;基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:敏感数据挖掘组件基于安全合规需求构建基于健康医疗领域的敏感信息知识图谱;并基于敏感信息知识图谱识别待测健康医疗数据中是否存在敏感信息。
8.在一示例性实施方式中,数据安全管理模块还包括:自动化定级组件;基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:自动化定级组件基于gbdt多分类算法对待测健康医疗数据的安全等级进行计算,获得待测数据的安全等级。
9.在一示例性实施方式中,数据安全管理模块还包括:自适应安全保护适配组件;基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保
护,具体还包括:数据安全管理模块预先基于不同的安全等级,配置对应的数据安全防护措施;自适应安全保护适配组件基于待测健康医疗数据的安全等级查询与安全等级对应的安全防护措施,并对待测健康医疗数据启用安全防护措施。
10.在一示例性实施方式中,应用服务模块包括:应用调用组件,应用调用组件用于基于应用场景需求从静态存储模块中抽取健康医疗数据,构建应用场景下的应用数据,存储在应用服务模块的存储区,并调用数据安全管理模块自动化定级组件对应用数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
11.在一示例性实施方式中,应用服务模块还包括交易共享组件,交易共享组件用于基于交易需求从静态存储模块中抽取健康医疗数据并对健康医疗数据进行重构,生成交易数据,存储在应用服务模块的存储区。
12.在一示例性实施方式中,交易共享组件还包括定制数据重构组件;对健康医疗数据进行重构的方法,具体包括:定制数据重构组件对健康医疗数据进行隐私数据脱敏,重构脱敏后的健康医疗数据,生成交易数据;调用数据安全管理模块的自动化定级组件对交易数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
13.在一示例性实施方式中,系统还包括数据汇聚模块;静态存储模块存储基于数据源采集的经过数据清洗的健康医疗数据,具体包括:数据汇聚模块,用于获取数据源的业务数据;对业务数据进行数据清洗,将清洗后的业务数据进行分类,以至少分离出系统数据和健康医疗数据;将业务数据按类别存储至静态存储模块。
14.根据本技术实施例的另一个方面,提供了一种基于健康医疗数据的安全管理方法,方法应用于基于健康医疗数据的安全管理系统,包括:获取数据源采集的经过数据清洗的健康医疗数据,并存储至静态存储模块;基于健康医疗业务场景的应用和/或服务,提取静态存储模块的健康医疗数据,生成应用数据;基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。
15.在一示例性实施方式中,获取数据源发来的经过数据清洗的健康医疗数据的方法,包括:获取数据源的业务数据;对业务数据进行数据清洗,将清洗后的业务数据进行分类,以至少分离出系统数据和健康医疗数据;将业务数据按类别存储至静态存储模块。
16.在一示例性实施方式中,基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:基于安全合规需求构建基于健康医疗领域的敏感信息知识图谱;并基于敏感信息知识图谱识别待测健康医疗数据中是否存在敏感信息。
17.在一示例性实施方式中,基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,基于gbdt多分类算法对待测健康医疗数据的安全等级进行计算,获得待测数据的安全等级。
18.在一示例性实施方式中,基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,还包括:数据安全管理模块预先基于不同的安全等级,配置对应的数据安全防护措施;自适应安全保护适配组件基于待测健康医疗数据的安全等级查询与安全等级对应的安全防护措施,并对待测健康医疗数据启用安全防护措施。
19.在一示例性实施方式中,基于健康医疗业务场景的应用和/或服务,提取静态存储模块的健康医疗数据,生成应用数据;具体包括:基于应用场景需求从静态存储模块中抽取
健康医疗数据,构建应用场景下的应用数据,存储在应用服务模块的存储区,并调用数据安全管理模块自动化定级组件对应用数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
20.在一示例性实施方式中,基于交易需求从静态存储模块中抽取健康医疗数据并对健康医疗数据进行重构,生成交易数据,存储在应用服务模块的存储区。
21.在一示例性实施方式中,对健康医疗数据进行重构,生成交易数据的方法还包括:对健康医疗数据进行隐私数据脱敏,重构脱敏后的健康医疗数据,生成交易数据;调用数据安全管理模块的自动化定级组件对交易数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
22.根据本技术实施例的另一个方面,一种电子设备,包括:至少一个处理器、至少一个存储器、以及至少一条通信总线,其中,该存储器上存储有计算机程序,该处理器通过该通信总线读取该存储器中的该计算机程序;该计算机程序被该处理器运行时实现上述基于健康医疗数据的安全管理方法。
23.根据本技术实施例的另一个方面,一种存储介质,其上存储有计算机程序,计算机程序被计算机的处理器运行时实现上述基于健康医疗数据的安全管理方法。
24.本技术提供的技术方案带来的有益效果是:
25.在上述技术方案中,通过对待存储的健康医疗数据进行敏感数据挖掘,根据敏感数据挖掘结果,对待存储的健康医疗数据进行安全级别的定级;针对不同安全级别的健康医疗数据,在数据生命周期各个环节制定合理的安全防护策略,从而克服现有技术中健康医疗数据存在网络攻击、隐私泄露等安全风险。
26.进一步的,数据安全管理模块的敏感数据挖掘组件通过构建敏感数据知识图谱作为识别依据;自动化定级组件采用gbdt多分类算法实现对数据安全等级的预测;并且预先为不同安全等级配置了安全保护措施,从而能够实现从敏感信息挖掘到数据安全等级的定级,再到安全保护措施的配置和启动的自动化和智能化的全流程安全管理;以克服健康医疗行业,因其业务复杂性导致的数据种类多、体量大、格式多样、数据分散,难以实现全局化管理等管理难题。而且本技术利用了知识图谱等手段进行敏感信息挖掘,并自动化定级和匹配安全措施,从而克服了长期以来依靠大量的人工投入进行分级的工作,又因受限于相关人员的专业能力,导致分级准确率低、周期长、人力成本投入大、自适应性差的问题。
附图说明
27.为了更清楚地说明本技术实施例中的技术方案,下面将对本技术实施例描述中所需要使用的附图作简单地介绍。
28.图1是本技术所涉及的实施环境示意图;
29.图2是根据一示例性实施例示出的基于健康医疗数据的安全管理系统架构图;
30.图3是根据一示例性实施例示出的基于健康医疗数据的安全管理系统的应用服务模块工作流程示意图;
31.图4是根据一示例性实施例示出的基于健康医疗数据的安全管理系统的安全管理模块框架示意图;
32.图5是根据一示例性实施例示出的基于健康医疗数据的安全管理方法流程图。
具体实施方式
33.下面详细描述本技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本技术,而不能解释为对本技术的限制。
34.本技术领域技术人员可以理解,除非特意声明,这里使用的单数形式“一”、“一个”、“所述”和“该”也可包括复数形式。应该进一步理解的是,本技术的说明书中使用的措辞“包括”是指存在所述特征、整数、步骤、操作、元件和/或组件,但是并不排除存在或添加一个或多个其他特征、整数、步骤、操作、元件、组件和/或它们的组。应该理解,当我们称元件被“连接”或“耦接”到另一元件时,它可以直接连接或耦接到其他元件,或者也可以存在中间元件。此外,这里使用的“连接”或“耦接”可以包括无线连接或无线耦接。这里使用的措辞“和/或”包括一个或更多个相关联的列出项的全部或任一单元和全部组合。
35.如前所述,本技术主要解决健康医疗领域数据的安全管理;其中,上述健康医疗领域数据,主要来源于卫生医疗机构(例如各规模医院)、健康体检机构、承保人身保险的保险机构等生产或存储人身健康、医疗数据的社会组织。健康医疗领域数据,即健康医疗数据,具体是指个人健康医疗数据以及由个人健康医疗数据加工处理之后得到的健康医疗相关电子数据。而个人健康医疗数据是指单独或者与其他信息结合后能够识别特定自然人或者反映特定自然人生理或心理健康的相关电子数据。健康医疗数据具有数据体量大、格式复杂多样、存储位置分散等特点。
36.近年来,随着云计算在各行各业中的推广,许多地区卫生、保险体系机构的数据中心陆续接入云平台,将数据上传至云端存储。然而,随着接入地区的扩大,数据的增多,访问量的加大,给存储在云端的健康医疗数据带来隐私泄露和数据滥用等安全隐患,可见,如何保证健康医疗数据在云端安全存储和安全访问,成为亟待解决的问题。
37.一直以来,为了解决这个问题,主要通过人工投入对数据进行安全分级,并依据安全等级,配置相应的安全保护措施。然而,受限于人工作业的专业能力,导致分类分级结果的准确率底下、周期长、人力成本高,自适应能力差的缺点,难以高效的解决健康医疗数据的安全管理问题。
38.为此,本技术提供的一种基于健康医疗数据的自动化安全管理系统,能够有效地对存储在云端的健康医疗数据进行数据安全管理。相应地,该基于健康医疗数据的安全管理系统也可部署于电子设备,该电子设备可以是配置冯诺依曼体系结构的计算机设备,例如,该计算机设备可以是台式电脑、笔记本电脑、服务器等;与此同时,该基于健康医疗数据的自动化安全管理装置还可以存储在存储介质内,该存储介质可以是硬盘、cd-rom、云存储等。
39.为使本技术的目的、技术方案和优点更加清楚,下面将结合附图对本技术实施方式作进一步地详细描述。
40.图1为基于健康医疗数据的安全管理系统所涉及的一种实施环境的示意图。需要说明的是,该种实施环境只是一个适配于本发明的示例,不能认为是提供了对本发明的使用范围的任何限制。
41.该实施环境包括采集端610和服务端630。
42.具体地,采集端610,可以是具有采集图片、文本、多媒体中至少一种或多种数据功
能的电子设备、虚拟设备或运行的采集程序,在此不构成具体限定。
43.服务端630,该服务端630可以是台式电脑、笔记本电脑、平板电脑、服务器等等电子设备或虚拟设备,还可以是由多台服务器构成的计算机设备集群,甚至是由多台服务器构成的云计算中心。其中,服务端630用于提供后台服务,例如,后台应用和/或服务包括但不限于对健康医疗数据的saas层应用、租户间的数据共享、交易等。
44.服务端630与采集端610之间通过有线或者无线等方式预先建立网络通信连接,并通过该网络通信连接实现服务端630与采集端610之间的数据传输。传输的数据包括但不限于:个人信息、医疗检测报告、医疗检验单数据等。
45.通过采集端610与服务端630的交互,采集端610从健康体检机构、医疗机构和人身保险的承保机构的数据中心获取健康医疗数据,并存储在服务端630,服务端630运行该基于健康医疗数据的安全管理系统,从而为存储在服务端630的健康医疗数据提供安全保护。
46.请参阅图2,图2是根据一示例性实施例示出的基于健康医疗数据的安全管理系统架构图。该基于健康医疗数据的安全管理系统100部署于电子设备中,为了说明的方便,本实施例将以该电子设备为具有计算功能的云存储服务器为例进行介绍。
47.如图2所示,该基于健康医疗数据的安全管理系统100包括数据汇聚模块110、静态存储模块130、应用服务模块150和数据安全管理模块170;其中,该数据汇聚模块110,用于将从数据源采集多源异构数据汇聚到基于健康医疗数据的安全管理系统中。该静态存储模块130,用于存储基于数据源采集的经过数据清洗的健康医疗数据。该应用服务模块150,用于基于健康医疗业务场景的应用和/或服务,提取该静态存储模块的健康医疗数据,生成应用数据。该数据安全管理模块170,用于基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。
48.数据汇聚模块110、静态存储模块130、应用服务模块150是基于数据应用属性,对存储在云存储服务器的数据进行逻辑分层处理,并根据逻辑分层在存储架构上进行相应的调整而得到的系统结构。
49.一种示例性实施方式,数据汇聚模块110,用于获取数据源的业务数据;对业务数据进行数据清洗,将清洗后的业务数据进行分类,以至少分离出系统数据和健康医疗数据;将业务数据按类别存储至静态存储模块130。
50.具体的,该数据汇聚模块110,用于将不同数据源的多源异构数据汇聚到该基于健康医疗数据的安全管理系统100;也即,采集端从各医疗机构、健康体检机构、人身保险的承保机构的数据中心采集到健康医疗数据后,统一发送给该基于健康医疗数据的安全管理系统100的数据汇聚模块110。由于不同机构、不同机器设备上运行的数据类型、格式各不相同,因此当采集端从各医疗机构、健康体检机构、人身保险的承保机构采集到的健康医疗数据通常属于多源异构数据。这些数据难以被后端的应用和服务直接调取使用,因此需要在数据汇聚模块110进行规范化处理,以生成规范数据。
51.一种可能的实施方式是:该数据汇聚模块110,用于获取数据源的业务数据,该数据源包括医疗机构数据中心、人身保险机构数据中心;对该业务数据进行数据清洗,该数据清洗至少包括去重、去除失效数据、规范化处理,从而获得清洗后的业务数据;将该清洗后的业务数据进行分类,类别至少包括系统数据和健康医疗数据;将该业务数据按类别存储至该静态存储模块130。
52.在一示例性实施方式中,该静态存储模块130对接该数据安全管理模块170;在将该规范数据存储到该静态存储模块130前,该静态存储模块130对接数据安全管理模块170对待存储的规范数据进行安全管理,即该数据安全管理模块170会对该规范数据进行安全等级评估,并提供相应等级的安全防护措施。该静态存储模块130还提供隔离存储能力,用于将不同安全级别的数据存储于不同隔离分区。
53.请参考图3,图3是根据一示例性实施例示出的基于健康医疗数据的安全管理系统的应用服务模块工作流程示意图。
54.在一示例性实施方式中,该应用服务模块150根据saas层应用或服务的需求,从该静态存储模块130中抽取相应的健康医疗数据,经过重构和/隐私处理,形成业务数据(针对saas层的应用来说,形成应用数据;对于服务来说,可以形成租户间的交易数据或共享数据)。
55.进一步的,该应用服务模块150包括应用调用组件151,该应用调用组件151基于应用场景需求从静态存储模块130中抽取健康医疗数据,构建应用场景下的应用数据,存储在应用服务模块的存储区155,并调用数据安全管理模块170自动化定级组件对应用数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
56.进一步的,该应用场景下的应用数据基于逻辑分层的方式存储在该应用服务模块的存储区155,以供健康医疗saas应用调用,进而为租户提供丰富的数据服务能力。该应用调用组件151基于应用所属租户进行资源隔离,以避免跨租户越权访问。
57.在一示例性实施方式中,该应用服务模块150还包括交易共享组件153,该交易共享组件153用于基于交易需求从静态存储模块130中抽取健康医疗数据并对健康医疗数据进行重构,生成交易数据,存储在应用服务模块的存储区。该交易数据主要用于数据交易以及不同数据所有权主体之间的数据共享。
58.进一步的,该交易数据至少包括两类数据:第一类数据是用于交易的数据元件,所谓数据元件是通过对数据脱敏处理后,根据需要由若干相关字段形成的数据集或由数据的关联字段通过建模形成的数据特征。具体的,根据需要抽取静态存储模块130的规范数据,并对涉及个人健康医疗数据信息进行去标识化处理后存储在该应用服务模块的存储区155。第二类数据是用于不同数据所有权主体之间的数据共享。具体的,根据定制化共享需求,该交易共享组件153从静态存储模块130中直接读取业务信息,重构形成待交易或共享的业务数据。由于共享需求的差异化,这里并不会对读取的相关数据进行去标识化处理,被读取的业务信息通常会保留住敏感信息;为此,需要调用该数据安全管理模块170根据敏感信息属性,进行分级安全保护,并且在监控到数据共享结束后,对该相关数据进行销毁。
59.在一示例性实施方式中,该交易共享组件153还包括定制数据重构组件(图未示);对健康医疗数据进行重构的方法,具体包括:定制数据重构组件对健康医疗数据进行隐私数据脱敏,重构脱敏后的健康医疗数据,生成交易数据;调用数据安全管理模块170的自动化定级组件对交易数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
60.请参考图4,图4是根据一示例性实施例示出的基于健康医疗数据的安全管理系统的安全管理方法流程图。由于数据安全保护的基础是对数据进行合理的分类分级,所谓数据分类是指:把具有某种共同属性或特征的数据归并在一起,通过其类别的属性或特征来对数据进行区别。因此,在本案种,基于从医疗机构的数据中心、人身保险机构的数据中心
获取的数据包括健康体检数据、医患诊疗数据、检测设备数据、系统日志等多种类型数据,这些数据基于不同用途和不同安全等级需要进行差别化管理。因此,首先需要对从数据源获取的数据进行分类,其次在进行安全分级。所谓数据分级是指根据数据的敏感程度和数据遭受篡改、破坏、泄露或非法利用后对受害者的影响程度,按照一定的原则和方法进行定义。因此,为了合理分配计算资源,更好的对数据进行安全合规保护,需要设计一种自动化智能化的数据安全管理模块170。
61.一示例性实施方式是:该数据安全管理模块170包括一敏感数据挖掘组件171、一自动化定级组件173和一自适应安全保护适配组件175;由于前述的健康医疗数据中存在大量个人信息,以及个人健康医疗数据,为了合规使用,在将规范数据持久化到静态存储模块130前,需要对该规范数据进行敏感信息挖掘;所谓敏感信息的界定,一方面可以通过适配相关法律,例如《网络安全法》以及相关司法解释、行政法规、行业规范等;另一方面,可以根据业务场景进行相应的配置。一种可能的实施方式是:根据经验,健康医疗数据中的敏感信息通常分布在患者姓名、身份证、电话、地址、检验检查信息、诊断信息、用药信息等关键字段上。而这些敏感信息是决定该条数据安全等级的主要参考因素,因此,需要对待存储的健康医疗数据进行敏感信息挖掘。
62.其中,该敏感数据挖掘组件171基于该安全合规需求构建基于健康医疗领域的敏感信息知识图谱;并基于该敏感信息知识图谱识别待测健康医疗数据中是否存在敏感信息;
63.具体的,通过预先构建敏感信息知识图谱;将敏感信息知识图谱作为敏感信息挖掘决策依据。一种构建敏感信息知识图谱可能的实施方式是:
64.s1:收集历史健康医疗数据信息作为训练集;标注出训练集数据的敏感信息;
65.s2:使用基于bi-lstm+crf的命名实体识别方法,抽取命名实体,形成第一实体词典;
66.s3:采用远监督标注数据下的关系分类,或采用实体关系联合抽取的方式实现对该训练集中的命名实体间的关系、属性的抽取;
67.s4:通过将抽取的命名实体及关系、属性存储到neo4j数据库;
68.s5:筛选患者姓名、身份证、电话、地址、检验检查信息、诊断信息、用药信息等关键字段生成敏感信息知识图谱。
69.进一步的,当构建好敏感信息知识图谱后,数据安全管理模块170通过调用敏感数据挖掘组件171,可以对待存储的规范数据进行敏感信息检测。通过实体链接敏感信息知识图谱的方式,判断该待存储的规范数据中是否存在敏感信息。当识别出该待存储的规范数据中存在敏感信息时,该系统通过调用数据安全管理模块170对该待存储的规范数据依照预设的安全保护措施进行安全保护。
70.此外,该自动化定级组件173用于基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:自动化定级组件基于gbdt多分类算法对待测健康医疗数据的安全等级进行计算,获得待测数据的安全等级。
71.具体的,在进行敏感信息挖掘后,该数据安全管理模块170根据敏感信息属性,自动调用该自动化定级组件173对该待存储的规范数据进行安全等级定级。一种可能的实现方式是:利用专家标记的分级数据作为训练集对gbdt多分类算法进行训练,从而构建一自
动化定级处理预测模型,该模型基于待存储的规范数据中的患者姓名、身份证、电话、地址、检验检查信息、诊断信息、用药信息等关键信息的分布情况形成二维特征向量输入,(特征向量的每个维度都由0和1构成,0代表数据中不存在相应的敏感信息,1代表数据中存在相应的敏感信息)经预测模型计算后可以确定待定级数据的数据安全级别(例如,可以将安全级别定义为低、中、高、特级,级别越高,适配的安全管控措施等级越高)。
72.在一示例性实施例中,在确定待测健康医疗数据的安全等级后,该数据安全管理模块170预先基于不同的安全等级,配置对应的数据安全防护措施。该数据安全管理模块170的自适应安全保护适配组件175基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。
73.具体的,该安全保护策略包括但不限于验证、授权、加密、水印等安全措施。该自适应安全保护适配组件175针对应用调用层及交易共享层中各数据的安全等级,调用并启动安全保护措施。
74.此外,自适应安全保护适配组件175基于待测健康医疗数据的安全等级查询与安全等级对应的安全防护措施,并对待测健康医疗数据启用安全防护措施。在一示例性实施例中,该数据安全管理模块170还可以调用外部安全组件,对数据进行安全管理。
75.请参考图5,图5揭示了一种基于健康医疗数据的安全管理方法,该方法应用于基于健康医疗数据的安全管理系统,该系统包括静态存储模块130、应用服务模块150以及数据安全管理模块170,该方法包括:
76.步骤310:获取数据源采集的经过数据清洗的健康医疗数据,并存储至静态存储模块130;
77.步骤330:基于健康医疗业务场景的应用和/或服务,提取静态存储模块130的健康医疗数据,生成应用数据;
78.步骤350:基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。
79.在一示例性实施方式中,获取数据源发来的经过数据清洗的健康医疗数据的方法,包括:获取数据源的业务数据;对业务数据进行数据清洗,将清洗后的业务数据进行分类,以至少分离出系统数据和健康医疗数据;将业务数据按类别存储至静态存储模块。
80.在一示例性实施方式中,基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:基于安全合规需求构建基于健康医疗领域的敏感信息知识图谱;并基于敏感信息知识图谱识别待测健康医疗数据中是否存在敏感信息。
81.在一示例性实施方式中,基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,基于gbdt多分类算法对待测健康医疗数据的安全等级进行计算,获得待测数据的安全等级。
82.在一示例性实施方式中,基于安全合规需求,对存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,还包括:数据安全管理模块预先基于不同的安全等级,配置对应的数据安全防护措施;自适应安全保护适配组件基于待测健康医疗数据的安全等级查询与安全等级对应的安全防护措施,并对待测健康医疗数据启用安全防护措施。
83.在一示例性实施方式中,基于健康医疗业务场景的应用和/或服务,提取静态存储
模块的健康医疗数据,生成应用数据;具体包括:基于应用场景需求从静态存储模块中抽取健康医疗数据,构建应用场景下的应用数据,存储在应用服务模块的存储区,并调用数据安全管理模块自动化定级组件对应用数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
84.在一示例性实施方式中,基于交易需求从静态存储模块中抽取健康医疗数据并对健康医疗数据进行重构,生成交易数据,存储在应用服务模块的存储区。
85.在一示例性实施方式中,对健康医疗数据进行重构,生成交易数据的方法还包括:对健康医疗数据进行隐私数据脱敏,重构脱敏后的健康医疗数据,生成交易数据;调用数据安全管理模块的自动化定级组件对交易数据进行安全等级评估,并基于安全等级对应用数据进行安全保护。
86.综上所述,本技术的实施例通过对待存储的健康医疗数据进行敏感数据挖掘,根据敏感数据挖掘结果,对待存储的健康医疗数据进行安全级别的定级;针对不同安全级别的健康医疗数据,在数据生命周期各个环节制定合理的安全防护策略,从而克服现有技术中健康医疗数据存在网络攻击、隐私泄露等安全风险。
87.进一步的,数据安全管理模块170的敏感数据挖掘组件171通过构建敏感数据知识图谱作为识别依据;自动化定级组件173采用gbdt多分类算法实现对数据安全等级的预测;并且预先为不同安全等级配置了安全保护措施,从而能够实现从敏感信息挖掘到数据安全等级的定级,再到安全保护措施的配置和启动这一全程安全管理实现自动化和智能化,从而克服了由于健康医疗行业的业务复杂性,健康医疗数据体量大、格式复杂多样、位置分散等特点,长期以来都需依靠大量的人工投入进行分级的工作,但受限于相关人员的专业能力,在这一过程中始终存在准确率低、周期长、投入大、自适应性差的问题。
88.应该理解的是,虽然附图的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,其可以以其他的顺序执行。而且,附图的流程图中的至少一部分步骤可以包括多个子步骤或者多个阶段,这些子步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,其执行顺序也不必然是依次进行,而是可以与其他步骤或者其他步骤的子步骤或者阶段的至少一部分轮流或者交替地执行。
89.以上所述仅是本技术的部分实施方式,应当指出,对于本技术领域的普通技术人员来说,在不脱离本技术原理的前提下,还可以做出若干改进和润饰,这些改进和润饰也应视为本技术的保护范围。
技术特征:
1.基于健康医疗数据的安全管理系统,其特征在于,包括:静态存储模块、应用服务模块以及数据安全管理模块;其中,所述静态存储模块,用于存储基于数据源采集的经过数据清洗的健康医疗数据;所述应用服务模块,用于基于健康医疗业务场景的应用和/或服务,提取所述静态存储模块的健康医疗数据,生成应用数据;所述数据安全管理模块,用于基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。2.如权利要求1所述的基于健康医疗数据的安全管理系统,其特征在于,所述数据安全管理模块包括:敏感数据挖掘组件;所述基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:所述敏感数据挖掘组件基于所述安全合规需求构建基于健康医疗领域的敏感信息知识图谱;并基于所述敏感信息知识图谱识别待测健康医疗数据中是否存在敏感信息。3.如权利要求1所述的基于健康医疗数据的安全管理系统,其特征在于,所述数据安全管理模块还包括:自动化定级组件;所述基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:所述自动化定级组件基于gbdt多分类算法对待测健康医疗数据的安全等级进行计算,获得待测数据的安全等级。4.如权利要求3所述的基于健康医疗数据的安全管理系统,其特征在于,所述数据安全管理模块还包括:自适应安全保护适配组件;所述基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体还包括:所述数据安全管理模块预先基于不同的安全等级,配置对应的数据安全防护措施;所述自适应安全保护适配组件基于所述待测健康医疗数据的安全等级查询与所述安全等级对应的安全防护措施,并对所述待测健康医疗数据启用所述安全防护措施。5.如权利要求3所述的基于健康医疗数据的安全管理系统,其特征在于,所述应用服务模块包括:应用调用组件,所述应用调用组件用于基于应用场景需求从所述静态存储模块中抽取所述健康医疗数据,构建所述应用场景下的应用数据,存储在所述应用服务模块的存储区,并调用所述数据安全管理模块所述自动化定级组件对所述应用数据进行安全等级评估,并基于所述安全等级对所述应用数据进行安全保护。6.如权利要求3所述的基于健康医疗数据的安全管理系统,其特征在于,所述应用服务模块还包括交易共享组件,所述交易共享组件用于基于交易需求从所述静态存储模块中抽取所述健康医疗数据并对所述健康医疗数据进行重构,生成交易数据,存储在所述应用服务模块的存储区。7.如权利要求6所述的基于健康医疗数据的安全管理系统,其特征在于,所述交易共享组件还包括定制数据重构组件;对所述健康医疗数据进行重构的方法,具体包括:所述定制数据重构组件对所述健康医疗数据进行隐私数据脱敏,重构所述脱敏后的健康医疗数据,生成交易数据;调用所述数据安全管理模块的自动化定级组件对所述交易数据进行安全等级评估,并基于所述安全等级对所述应用数据进行安全保护。8.如权利要求1所述的基于健康医疗数据的安全管理系统,其特征在于,所述系统还包括数据汇聚模块;所述静态存储模块存储基于数据源采集的经过数据清洗的健康医疗数
据,具体包括:所述数据汇聚模块,用于获取数据源的业务数据;对所述业务数据进行数据清洗,将所述清洗后的业务数据进行分类,以至少分离出系统数据和健康医疗数据;将所述业务数据按类别存储至所述静态存储模块。9.一种基于健康医疗数据的安全管理方法,所述方法应用于基于健康医疗数据的安全管理系统,其特征在于,包括:获取数据源采集的经过数据清洗的健康医疗数据,并存储至静态存储模块;基于健康医疗业务场景的应用和/或服务,提取所述静态存储模块的健康医疗数据,生成应用数据;基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。10.如权利要求9所述的基于健康医疗数据的安全管理方法,其特征在于,所述获取数据源发来的经过数据清洗的健康医疗数据的方法,包括:获取数据源的业务数据;对所述业务数据进行数据清洗,将所述清洗后的业务数据进行分类,以至少分离出系统数据和健康医疗数据;将所述业务数据按类别存储至所述静态存储模块。11.如权利要求9所述的基于健康医疗数据的安全管理方法,其特征在于,所述基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,具体包括:基于所述安全合规需求构建基于健康医疗领域的敏感信息知识图谱;并基于所述敏感信息知识图谱识别待测健康医疗数据中是否存在敏感信息。12.如权利要求11所述的基于健康医疗数据的安全管理方法,其特征在于,所述基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,基于gbdt多分类算法对待测健康医疗数据的安全等级进行计算,获得待测数据的安全等级。13.如权利要求12所述的基于健康医疗数据的安全管理方法,其特征在于,所述基于安全合规需求,对存入所述基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护,还包括:所述数据安全管理模块预先基于不同的安全等级,配置对应的数据安全防护措施;所述自适应安全保护适配组件基于所述待测健康医疗数据的安全等级查询与所述安全等级对应的安全防护措施,并对所述待测健康医疗数据启用所述安全防护措施。14.如权利要求9所述的基于健康医疗数据的安全管理方法,其特征在于,基于健康医疗业务场景的应用和/或服务,提取所述静态存储模块的健康医疗数据,生成应用数据;具体包括:基于应用场景需求从所述静态存储模块中抽取所述健康医疗数据,构建所述应用场景下的应用数据,存储在所述应用服务模块的存储区,并调用所述数据安全管理模块所述自动化定级组件对所述应用数据进行安全等级评估,并基于所述安全等级对所述应用数据进行安全保护。15.如权利要求9所述的基于健康医疗数据的安全管理方法,其特征在于,基于交易需求从所述静态存储模块中抽取所述健康医疗数据并对所述健康医疗数据进行重构,生成交
易数据,存储在所述应用服务模块的存储区。16.如权利要求15所述的基于健康医疗数据的安全管理方法,其特征在于,所述对所述健康医疗数据进行重构,生成交易数据的方法还包括:对所述健康医疗数据进行隐私数据脱敏,重构所述脱敏后的健康医疗数据,生成交易数据;调用所述数据安全管理模块的自动化定级组件对所述交易数据进行安全等级评估,并基于所述安全等级对所述应用数据进行安全保护。17.一种电子设备,其特征在于,包括:至少一个处理器、至少一个存储器、以及至少一条通信总线,其中,所述存储器上存储有计算机程序,所述处理器通过所述通信总线读取所述存储器中的所述计算机程序;所述计算机程序被所述处理器执行时实现如权利要求9至16任一项所述的基于健康医疗数据的安全管理方法。18.一种存储介质,其特征在于,包括:其上存储有计算机程序,计算机程序被计算机处理器执行时实现如权利要求9至16任一项所述的基于健康医疗数据的安全管理方法。
技术总结
本申请实施例提供了一种基于健康医疗数据的安全管理系统,包括静态存储模块、应用服务模块以及数据安全管理模块;其中,静态存储模块,用于存储基于数据源采集的经过数据清洗的健康医疗数据;应用服务模块,用于基于健康医疗业务场景的应用和/或服务,提取静态存储模块的健康医疗数据,加工并生成应用数据;数据安全管理模块,用于基于安全合规需求,存入基于健康医疗数据的安全管理系统的健康医疗数据进行安全保护。本申请实施例能够有效地解决健康医疗数据在存储和访问过程中的数据安全管理问题。全管理问题。全管理问题。
技术研发人员:徐牧池 徐辉 吴鹏 吕品
受保护的技术使用者:中电通商数字技术(上海)有限公司
技术研发日:2023.04.25
技术公布日:2023/8/9
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/