一种人工智能生成内容处理方法、系统、设备及存储介质与流程
未命名
10-26
阅读:57
评论:0
1.本发明属于人工智能领域,尤其涉及一种人工智能生成内容处理方法、系统、设备及存储介质。
背景技术:
2.随着ai技术的高速发展,越来越多的aigc(artificial intelligence generated content,指人工智能生成内容)相关应用进入人们视野,不论是“博闻强识”的chatgpt,还是“妙笔生花”的midjourney,其生成的内容均属于人工智能生成内容的范畴。人工智能生成内容对人类社会造成了变革性的冲击,给许多行业带来了生产力的提升,但同时也带来了许多问题。在许多场景下,都需要对aigc进行识别,对生成的图片、视频等内容进行标识。
3.现有的数据识别鉴定技术主要有:基于非对称加密的数字签名技术和内容散列技术。虽然发展都较为成熟,但目前均作为通用的防篡改验证技术,没有针对人工智能生成内容特点制定完善的标准规范,无法根据数字签名或内容散列值获取内容生成方身份等重要信息,难以对aigc进行合理的鉴定、溯源。此外,当数据内容局部发生变化时,如对图像数据进行裁剪、对文字数据进行截取摘要时,常见的散列算法生成的新散列值与原来完整数据的散列值可能完全不同,即无法从散列值上判断两者的相似性,因此难以对数据进行相似性验证。
技术实现要素:
4.针对现有技术中存在的技术问题,本发明提供一种人工智能生成内容的处理方法、系统、设备及存储介质,采用了基于非对称加密的数字签名技术,通过定义人工智能生成内容的元信息字段和对人工智能生成内容采用模糊哈希算法进行内容散列,使数字签名包含内容生成方身份和分片的人工智能生成内容散列值信息,达到了有效对人工智能生成内容进行鉴定、溯源和内容验证的效果。
5.根据本发明的第一方面,本发明提供一种人工智能生成内容的处理方法,包括:步骤1.对人工智能生成内容进行加密数字签名;包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段,对所述元信息字段进行编码,得到各个字段的编码结果;计算各个字段的编码结果的字节长度,按顺序拼接得到长度固定的头字段,将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得到签名信息,使用非对称加密算法生成私钥,对所述签名信息进行加密,生成最终的数字签名;步骤2.对所述加密数字签名进行解密;步骤3.对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。
6.在上述技术方案的基础上,本发明还可以作出如下改进。
7.可选的,所述第一散列值是指对人工智能生成内容使用模糊哈希算法进行散列得
到的结果值;所述元信息字段包括:模型版本信息、发布者信息、生成内容信息、预留段1、预留段2。
8.可选的,在对所述元信息字段进行编码,得到各个字段的编码结果中,采用utf-8进行编码,其中,每个字段编码后的最大字节长度限制为255。
9.可选的,所述对所述加密数字签名进行解密包括:使用私钥所对应的公钥,对数字签名进行解密得到签名信息。
10.可选的,所述对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证包括:使用私钥所对应的公钥,对数字签名进行解密得到签名信息;读取所述签名信息开头的头字段,确定所述元信息字段编码的长度,按长度从所述签名信息中读取出以utf-8编码的元信息字段的内容,用于进行人工智能生成内容的鉴定和溯源;根据所述头字段中记录的长度,计算出所述第一散列值在所述签名信息中的起始字节位置,据此拆分得到第一散列值;对人工智能生成内容使用模糊哈希算法进行散列得到第二散列值,与数字签名中的所述第一散列值进行比对,得到第二散列值与第一散列值之间的相似度分数,用于内容验证。
11.可选的,所述对人工智能生成内容使用模糊哈希算法进行散列得到第二散列值,与数字签名中的所述第一散列值进行比对包括:判断两个哈希值是否相等的一致性比对、计算两个哈希值相同字符个数或哈希值字符串相似度的相似性比对。
12.根据本发明的第二方面,提供一种人工智能生成内容的处理方法系统,包括:第一模块,用于对人工智能生成内容进行加密数字签名;包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段,对所述元信息字段进行编码,得到各个字段的编码结果;计算各个字段的编码结果的字节长度,按顺序拼接得到长度固定的头字段,将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得到签名信息,使用非对称加密算法生成私钥,对所述签名信息进行加密,生成最终的数字签名;第二模块,用于对所述加密数字签名进行解密;第三模块,用于对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。
13.本发明还提供一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现如上述任一所述人工智能生成内容的处理方法的步骤。
14.本发明还提供一种非暂态计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现如上述任一所述人工智能生成内容的处理方法的步骤。
15.本发明的技术效果和优点:本发明提供的一种人工智能生成内容的处理方法、系统、设备及存储介质,通过定义人工智能生成内容相关的多个元信息字段,实现人工智能生成内容的加密和解密后的验证。同时,所定义的头字段head用于记录元信息字段长度,实现了元信息字段内容在不同长度下均可读取的效果。
16.并且,通过元信息字段形成人工智能生成内容的数字摘要,在数字签名中包含了内容生成方身份等信息,使数字签名具备了对人工智能生成内容进行鉴定、溯源的能力。用模糊哈希进行内容散列,在数字签名中包含了内容的分片散列值,使数字签名具备了对人工智能生成内容进行相似性、完整性验证的能力。
17.本发明的其它特征和优点将在随后的说明书中阐述,并且,部分地从说明书中变得显而易见,或者通过实施本发明而了解。本发明的目的和其他优点可通过在说明书、权利要求书以及附图中所指出的结构来实现和获得。
附图说明
18.图1是本发明实施例提供的一种人工智能生成内容处理方法流程图;图2是本发明实施例提供的数字摘要编码m的示意图;图3是本发明实施例提供的生成数字签名的示意图;图4为本发明实施例提供的一种可能的电子设备的硬件结构示意图。
具体实施方式
19.为使本发明的目的、技术方案和优点更加清楚,下面将结合本发明中的附图,对本发明中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
20.可以理解的是,基于背景技术中的缺陷,本发明实施例提出了一种人工智能生成内容处理方法,参考如图1所示,包括以下步骤:步骤s1.对人工智能生成内容进行加密数字签名;在本实施例中,所述对人工智能生成内容进行加密数字签名具体包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段;对所述元信息字段,采用utf-8进行编码,得到各个字段的编码结果,其中,每个字段编码后的最大字节长度限制为255;计算各个字段的所述编码结果的字节长度,按顺序拼接得到长度固定的头字段,其中,所述头字段通过1个字节表示;将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得到签名信息,使用非对称加密算法rsa生成私钥;对所述签名信息进行加密,生成最终的数字签名。
21.需要进行说明的是,所述元信息字段包括:模型版本信息、发布者信息、生成内容信息、预留段1、预留段2。
22.本发明公开的技术方案,所定义的头字段head用于记录元信息字段长度,实现了元信息字段内容在不同长度下均可读取的效果。
23.所述第一散列值是指对人工智能生成内容使用模糊哈希算法进行散列得到的结果值;所述模糊哈希算法为:由jason sherman开发的开源工具ssdeep中的fuzzyhash方法。模糊哈希算法:基于内容分割的分片哈希算法。核心思想:使用弱哈希计算文件局部内容,
特定条件下进行内容分片,再使用强哈希对分片计算哈希值,最后与分片条件一起构成模糊哈希结果,通过对比哈希值的字符串相似度得到两个文件内容的相似性。
24.以下使用伪代码形式,说明数字签名方法的具体实施方式。在加密进行数字签名时,参考如图2所示,分以下步骤:加密步骤1.1:根据人工智能生成内容结果,使用由jason sherman开发的开源工具ssdeep中的fuzzyhash方法作为模糊哈希算法,对人工智能生成内容进行散列,获得散列值h;加密步骤1.2:统计生成结果时的相关元信息字段。具体包括:模型发布者名称、模型名称、模型版本号、模型调用者名称、内容生成日期、模型输入指令、生成内容类型、预留段1、预留段2;加密步骤1.3:对加密步骤2中的9个元信息字段,采用utf-8进行编码,每个字段编码后的最大字节长度限制为255,编码后超出长度的部分将被截断丢弃,最终得到编码后的结果m1,m2,...,m9;加密步骤1.4:计算m1,m2,...,m9的字节长度l1,l2,...,l9,长度使用1个字节表示,将l1至l9按顺序拼接,得到长度固定为9个字节的头字段head;加密步骤1.5:将头字段head与编码后的元信息字段m1,m2,...,m9按顺序拼接,得到最终的数字摘要编码m;加密步骤1.6:将数字摘要编码m与内容散列值h拼接,得到签名信息si,使用私钥对拼接结果进行加密,生成最终的数字签名s;本发明实施例通过定义人工智能生成内容相关的9个元信息字段,提供了一种元信息字段的定义方法,有助于实现人工智能生成内容的加密和解密后的验证。
25.步骤s2.对所述加密数字签名进行解密;在本实施例中,所述对所述加密数字签名进行解密具体包括:使用私钥所对应的公钥对数字签名进行解密得到签名信息。
26.参考如图3所示,解密数字签名时,分以下步骤:解密步骤2.1:使用公钥对数字签名s进行解密得到签名信息si;解密步骤2.2:读取si开头的9个字节(即数字摘要编码m中的头字段head),确定元信息字段m1,m2,...,m9的长度,即可按长度从si中读取出以utf-8编码的元信息字段内容;解密步骤2.3:根据头字段head中记录的长度,计算出散列值h在签名信息si中的起始字节位置,据此拆分得到散列值h;解密步骤2.4:对待识别的人工智能生成内容使用模糊哈希进行散列,即可将得到散列值htemp与数字签名中得到的h进行比对,得到待识别人工智能生成内容与数字签名对应的人工智能生成内容之间的相似度分数score。
27.步骤s3.对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。
28.在本实施例中,所述对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证具体包括:读取签名信息开头的头字段,确定所述元信息字段编码的长度,按长度从所述签名信息中读取出以utf-8编码的所述元信息字段的内容,其中,所述元信息字段的内容用于进行人工智能生成内容的鉴定和溯源;
根据所述头字段中记录的长度,计算出所述第一散列值在所述签名信息中的起始字节位置,据此拆分得到所述第一散列值;对人工智能生成内容使用模糊哈希算法进行散列得到第二散列值,与数字签名中的所述第一散列值进行比对,得到所述第二散列值与所述第一散列值之间的相似度分数,用于内容验证。
29.更进一步,将待鉴定的aigc数字签名进行解密,可以获取保存在数字摘要中的元信息字段,据此可鉴定当前aigc所使用的模型版本、发布者信息和生成内容的信息。
30.其次,根据解密后获取的数字摘要,可以获取aigc的发布者信息,据此可追溯内容生成方的身份。
31.最后,对待验证的aigc进行模糊哈希运算,与数据库中的其他aigc的模糊哈希值进行相似性计算,可以得到待验证aigc与数据库其他aigc的相似性分数,以此验证内容的相似性和完整性。
32.在具体应用示例中,例如:存在一段由ai生成的图片c和数字签名s;当需要鉴定该图片由哪个版本的模型生成时,可以将数字签名s中,数字摘要所包含的模型版本信息元字段内容解密用于鉴定。当需要追溯该图片由哪家企业的何种模型生成时,可以将数字签名s中,数字摘要所包含的模型版本信息和发布者信息元字段内容解密用于溯源。当需要验证该图片是否被篡改时,可以将数字签名s中,模糊哈希值h1进行解密,并对图片c进行模糊哈希运算得到模糊哈希值h2,对h1和h2进行相似性计算,可以得到两者的相似性分数,若计算得到的h2与数字签名s中解密出的h1相似度较低,可以判断图片被篡改。
33.需要进行说明的是,相似度分数用来反映两个哈希值所代表的两个内容的相似程度。模糊哈希和哈希值比对均使用由jason sherman开发的开源工具ssdeep中的方法。将得到的散列值与数字签名中得到的散列值进行比对包括但不限于:判断两个哈希值是否相等的一致性比对、计算两个哈希值相同字符个数或哈希值字符串相似度的相似性比对。
34.基于此,本发明实施例通过元信息字段形成人工智能生成内容的数字摘要,在数字签名中包含了内容生成方身份等信息,使数字签名具备了对人工智能生成内容进行鉴定、溯源的能力。用模糊哈希进行内容散列,在数字签名中包含了内容的分片散列值,使数字签名具备了对人工智能生成内容进行相似性、完整性验证的能力。
35.下面对本发明提供的一种人工智能生成内容处理系统进行描述,下文描述的一种人工智能生成内容处理系统与上文描述的一种人工智能生成内容处理方法可相互对应参照。
36.另一方面,本发明实施例还提出了一种人工智能生成内容处理系统,包括:第一模块,用于对人工智能生成内容进行加密数字签名;包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段,对所述元信息字段进行编码,得到各个字段的编码结果;计算各个字段的编码结果的字节长度,按顺序拼接得到长度固定的头字段,将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得到签名信息,使用非对称加密算法生成私钥,对所述签名信息进行加密,生成最终的数字签名;第二模块,用于对所述加密数字签名进行解密;
第三模块,用于对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。
37.可以理解的是,本发明提供的一种人工智能生成内容处理系统与前述各实施例提供的一种人工智能生成内容处理方法相对应,一种人工智能生成内容处理方法的相关技术特征可参考多源一种人工智能生成内容处理方法的相关技术特征,在此不再赘述。
38.图4示例了一种电子设备的实体结构示意图,如图4所示,该电子设备可以包括:处理器(processor)810、通信接口(communications interface)820、存储器(memory)830和通信总线840,其中,处理器810,通信接口820,存储器830通过通信总线840完成相互间的通信。处理器810可以调用存储器830中的逻辑指令,以执行一种人工智能生成内容处理方法,该方法包括如下步骤:步骤s1:对人工智能生成内容进行加密数字签名;包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段,对所述元信息字段进行编码,得到各个字段的编码结果;计算各个字段的编码结果的字节长度,按顺序拼接得到长度固定的头字段,将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得到签名信息,使用非对称加密算法生成私钥,对所述签名信息进行加密,生成最终的数字签名;步骤s2:对所述加密数字签名进行解密;步骤s3:对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。
39.此外,上述的存储器830中的逻辑指令可以通过软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
40.又一方面,本发明实施例还提供一种计算机程序产品,所述计算机程序产品包括计算机程序,计算机程序可存储在非暂态计算机可读存储介质上,所述计算机程序被处理器执行时,计算机能够执行上述所提供的一种人工智能生成内容处理方法,该方法包括:步骤s1:对人工智能生成内容进行加密数字签名;包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段,对所述元信息字段进行编码,得到各个字段的编码结果;计算各个字段的编码结果的字节长度,按顺序拼接得到长度固定的头字段,将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得到签名信息,使用非对称加密算法生成私钥,对所述签名信息进行加密,生成最终的数字签名;步骤s2:对所述加密数字签名进行解密;步骤s3:对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。
41.综上,本发明实施例在于提供一种针对人工智能生成内容特点的数字签名方法及
规范标准。基于非对称加密的数字签名技术,通过定义人工智能生成内容的元信息字段和对人工智能生成内容进行内容散列,使数字签名包含内容生成方身份和人工智能生成内容散列摘要值等信息,达到了有效对人工智能生成内容进行鉴定、溯源和内容完整性验证的效果。首次提出了针对人工智能生成内容特点的数字签名规范标准,对于人工智能领域生成式模型发展的规范性、健康性发展具有重要意义。
42.通过以上的实施方式的描述,本领域的技术人员可以清楚地了解到各实施方式可借助软件加必需的通用硬件平台的方式来实现,当然也可以通过硬件。基于这样的理解,上述技术方案本质上或者说对现有技术做出贡献的部分可以以软件产品的形式体现出来,该计算机软件产品可以存储在计算机可读存储介质中,如rom/ram、磁碟、光盘等,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行各个实施例或者实施例的某些部分所述的方法。
43.最后应说明的是:以上实施例仅用以说明本发明的技术方案,而非对其限制;尽管参照前述实施例对本发明进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本发明各实施例技术方案的精神和范围。
技术特征:
1.一种人工智能生成内容处理方法,其特征在于,包括以下步骤:步骤1.对人工智能生成内容进行加密数字签名;包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段;对所述元信息字段进行编码,得到各个字段的编码结果;计算各个字段的编码结果的字节长度,按顺序拼接得到长度固定的头字段,将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得到签名信息,使用非对称加密算法生成私钥,对所述签名信息进行加密,生成最终的数字签名;步骤2.对所述加密数字签名进行解密;步骤3.对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。2.根据权利要求1所述的一种人工智能生成内容处理方法,其特征在于,所述第一散列值是指对人工智能生成内容使用模糊哈希算法进行散列得到的结果值;所述元信息字段包括:模型版本信息、发布者信息、生成内容信息、预留段1、预留段2。3.根据权利要求1所述的一种人工智能生成内容处理方法,其特征在于,在对所述元信息字段进行编码,得到各个字段的编码结果中,采用utf-8进行编码,其中,每个字段编码后的最大字节长度限制为255。4.根据权利要求1所述的一种人工智能生成内容处理方法,其特征在于,所述对所述加密数字签名进行解密包括:使用私钥所对应的公钥,对数字签名进行解密得到签名信息。5.根据权利要求1所述的一种人工智能生成内容处理方法,其特征在于,所述对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证包括:读取所述签名信息开头的头字段,确定所述元信息字段编码的长度,按长度从所述签名信息中读取出以utf-8编码的元信息字段的内容,用于进行人工智能生成内容的鉴定和溯源;根据所述头字段中记录的长度,计算出所述第一散列值在所述签名信息中的起始字节位置,据此拆分得到第一散列值;对人工智能生成内容使用模糊哈希算法进行散列得到第二散列值,与数字签名中得到的所述第一散列值进行比对,得到第二散列值与第一散列值之间的相似度分数,用于内容验证。6.根据权利要求5所述的一种人工智能生成内容处理方法,其特征在于,所述对人工智能生成内容使用模糊哈希算法进行散列得到第二散列值,与数字签名中得到的所述第一散列值进行比对包括:判断两个哈希值是否相等的一致性比对、计算两个哈希值相同字符个数或哈希值字符串相似度的相似性比对。7.一种人工智能生成内容处理系统,其特征在于,包括:第一模块,用于对人工智能生成内容进行加密数字签名;包括:根据人工智能生成内容结果,使用模糊哈希算法对人工智能生成内容进行散列,得到第一散列值;统计人工智能生成内容的相关元信息字段;对所述元信息字段进行编码,得到各个字段的编码结果;计算各个字段的编码结果的字节长度,按顺序拼接得到长度固定的头字段,将所述头字段与所述编码结果按顺序拼接,得到数字摘要编码;将所述数字摘要编码与所述第一散列值拼接,得
到签名信息,使用非对称加密算法生成私钥,对所述签名信息进行加密,生成最终的数字签名;第二模块,用于对所述加密数字签名进行解密;第三模块,用于对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。8.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现如权利要求1至6任一项所述一种人工智能生成内容处理方法的步骤。9.一种非暂态计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至6任一项所述一种人工智能生成内容处理方法的步骤。
技术总结
本发明提供一种人工智能生成内容处理方法、系统、设备及存储介质,其技术要点在于:所述方法包括:步骤S1:对人工智能生成内容进行加密数字签名;步骤S2:对所述加密数字签名进行解密;步骤S3:对解密之后的所述加密数字签名进行鉴定、溯源及完整性验证。本发明公开的技术方案,通过元信息字段形成人工智能生成内容的数字摘要,在数字签名中包含了内容生成方身份信息,使数字签名具备了对人工智能生成内容进行鉴定、溯源的能力。用模糊哈希进行内容散列,在数字签名中包含了内容的分片散列值,使数字签名具备了对人工智能生成内容进行相似性、完整性验证的能力。完整性验证的能力。完整性验证的能力。
技术研发人员:聂昱 邓植丹
受保护的技术使用者:武汉汉王数据技术有限公司
技术研发日:2023.09.12
技术公布日:2023/10/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/