可溯源的文本隐写方法及文本文件信息泄露后的溯源方法与流程
未命名
09-22
阅读:99
评论:0
1.本技术涉及信息安全技术,更为具体地,涉及文本信息隐写技术。
背景技术:
2.信息隐写是关于信息隐藏,即不让计划的接收者之外的任何人知道信息的传递事件(而不只是信息的内容)的一门技巧与科学。文本类信息隐写技术通常依赖介质,这其中水印技术的应用相对广泛。
3.总得来说,现有的信息隐写技术存在以下问题:对于word、txt等纯文本内容而言,效果不好,所以使用场景有限;依赖介质,一旦介质丢失,隐写信息即丢失;容易被察觉;隐写信息易破解,基于图片识别技术等可去除隐写信息,容易破解隐写信息。
技术实现要素:
4.根据本技术的一些方面,提供可溯源的文本隐写方法,以至少解决现有隐写技术中的一个问题。
5.根据本技术示例的可溯源的文本隐写方法,包括:对原始文本进行语句划分,从而形成多个划分语句;基于语义数据库,为所述多个划分语句中的每一句或部分划分语句创建能表达原语义的新语句;以所创建的新语句结合所述原始文本创建多个与原始文本对应的隐写文本,各所述隐写文本彼此不同;将各所述隐写文本与所述原始文本的差别记录到隐写记录中。
6.所示例的可溯源的文本隐写方法,示例地,所述对原始文本进行语句划分,包括:将所述原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的各划分位置。所示例的可溯源的文本隐写方法,示例地,所述对原始文本进行语句划分还包括:对所述多个划分语句中的至少一个划分语句,以第二分隔方式将其划分成多个分词,并记录第二分隔方式下的各划分位置。
7.所示例的可溯源的文本隐写方法,示例地,所述基于语义数据库,为所述多个划分语句中的每一句或部分语句创建能表达原语义的新语句,包括从语义数据库为所述多个分词中的每一个或部分分词索引一个或多个新词;以所述新词并基于所述第二分隔方式下的各划分位置,创建所述多个划分语句的新语句;以及所述以所创建的新语句结合所述原始文本创建与原始文本对应的隐写文本,包括基于所述第一分隔方式下的各划分位置,以所述新语句结合所述原始文本创建多个与原始文本对应的隐写文本。
8.所示例的可溯源的文本隐写方法,示例地,所述方法还包括在语义数据库为所述多个分词中的每一个索引一个或多个新词后,将所索引的新词以与相应分词关联的方式存储到新词记录中。
9.所示例的可溯源的文本隐写方法,示例地,所述方法还包括:验证所索引的新词是否能表达所述相应分词的语义,且仅在通过验证的情况下,将所索引的新词存储到所述新词记录中。
10.所示例的可溯源的文本隐写方法,示例地,所述第一分隔方式包括以下方式中的一种或多种:按照标点分隔的方式;按照谓语分隔的方式;按照表达意思完整度分隔的方式。所示例的可溯源的文本隐写方法,示例地,所述第二分隔方式是按照词性分隔。
11.根据本技术的又一方面,还提供文本文件信息泄露后的溯源方法,所述方法包括:将泄露的隐写文本与原始文本比较以确定两者的差别;根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本使用方的信息;其中,所述隐写文本根据上文所述的任意一种方法创建;其中,所述隐写记录还包括各隐写文本的使用方信息。
12.还提供一种文本文件管理方法,所述方法包括:根据对文本文件的请求,按照上文所述的任意一种方法创建针对所请求的文本文件的隐写文本;将所述隐写文件作为所请求的文件,发送给文件请求方,并在所述隐写记录中记录与请求方有关的信息。
13.根据本技术的再一示例,还提供一种可溯源的文本隐写系统,所述系统包括:第一单元,用于对原始文本进行语句划分,从而形成多个划分语句;第二单元,用于基于语义数据库,为所述多个划分语句中的每一个或部分创建能表达原语义的新语句;第三单元,用于以所创建的新语句结合所述原始文本创建多个与原始文本对应的隐写文本,其中,各所述隐写文本彼此不同;存储单元,用于存储隐写记录,所述隐写记录包括所记录的各所述隐写文本与所述原始文本的差别。
14.所述的可溯源的文本隐写系统,示例地,所述第一单元设置为将所述原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的各划分位置;对所述多个划分语句中的至少一个划分语句,以第二分隔方式将其划分成多个分词,并记录第二分隔方式下的各划分位置。
15.所述的可溯源的文本隐写系统,示例地,所述第二单元设置为从语义数据库为所述多个分词中的每一个索引一个或多个新词;以索引的新词和所述第二分隔方式下的各划分位置为所述多个划分语句创建新语句;以及所述第三单元设置为基于所述第一分隔方式下的各划分位置,以所述新语句结合所述原始文本创建多个与原始文本对应的隐写文本。
16.根据本技术的另外一方面,还提供一种文本文件信息泄露后的溯源系统,所述系统包括:比较单元,用于泄露的隐写文本与原始文本比较以确定两者的差别;使用方确定单元,用于根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本使用方的信息;其中,所述隐写文本根据上文所述的任意一种方法创建或由上文所述的可溯源的文本隐写系统中的任意一种创建。
17.还提供一种电子设备,其包括处理器和存储器,所述存储器存储指令,所述处理器配置能处理所述指令且在执行所述指令时能实现根据上文所述的任意一种方法。
18.还提供一种计算机可读存储介质,所述存储介质用于存储指令,所述存储指令在被执行时,能实现根据上文所述的任意一种方法。该存储介质为非暂存性存储介质。
附图说明
19.结合附图参阅以下具体实施方式的详细说明,将更加充分地理解本技术,其中:
20.图1是根据本技术示例的可溯源的文本隐写方法的流程图;
21.图2是根据本技术又一示例的可溯源的文本隐写方法的流程图;
22.图3示意了文本文件a按照本技术示例的可溯源的文本隐写方法隐写的过程;
23.图4是根据本技术示例的文本文件信息泄露后的溯源方法的流程图;
24.图5是根据本技术示例的文本文件管理方法的流程图;
25.图6是根据本技术示例的可溯源的文本隐写系统的结构示意图;
26.图7是根据本技术示例的本文件信息泄露后的溯源系统的结构示意图。
具体实施方式
27.为帮助本领域的技术人员确切地理解本技术要求保护的主题,下文将结合附图详细描述本技术的具体实施方式。
28.图1是根据本技术示例的可溯源的文本隐写方法的流程图。如图1所示,在步骤s100,对原始文本进行语句划分,形成多个划分语句。在步骤s102,基于语义数据库,为多个划分语句中的每一个语句或部分语句创建能表达原语义的新语句。在步骤s104,以所创建的新语句结合原始文本创建与原始文本对应的隐写文本,在隐写文本存在多个的情况下,各隐写文本彼此不同。在步骤s106,记录各隐写文本与原始文本的差别创建的隐写记录中,该隐写记录可以适当的方式创建以便在其中记录原始文本与每一个隐写记录的差别。作为示例,原始文本与每一个隐写文本的差别以及该隐写文本相关信息可作为一条记录。该隐写记录可例如构建为数据库形式。
29.根据本技术的各示例,语义数据库可以是基于自然语言处理技术创建的语言库,也可以是网络上已有的语言库,或以其它方式建立的语言库等,本技术对此不做限制。
30.根据本技术的一些例子,以随机方式从所创建的新语句中取得一个或若干,取代它们在文件原始文本中的原划分语句,从而形成多个不同的隐写文本。
31.图2是根据本技术又一示例的可溯源的文本隐写方法的流程图。在步骤s200,将原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的每个划分位置。第一分隔方式例如是通过标点符号来划分的方式;或按照谓语来划分的方式;或按照表达意思的完整度来划分的方式。在按照谓语划分的情况下,可主要参考句子的谓语动词划分。在按照表达意思的完整度划分的情况下,划分的语句有可能为一个段落。示例地,对划分位置的记录,可通过每一个划分位置所在的划分语句在原始文本的位置来记录,比如文本第几段第几句等。还可参考该划分语句在原始文本中的所在页、以及该语句在该页的行号等来记录划分位置。
32.在步骤s202,对多个划分语句中的至少一个划分语句,以第二分隔方式将其划分成多个分词,并记录第二分隔方式下的各划分位置。第二分隔方式,可根据词的词性确定,其中,词性包括代词、名词、动词、形容词等。对第二分隔方式下划分位置的记录与对第一隔方式下的划分记录相似。对划分位置的记录意在记录各划分语句的准确位置、划分词的准确位置,能达成此目的的记录方式均可。
33.在步骤s204,从语义数据库为多个分词中的每一个或部分分词索引一个或多个新词。具体而言,可为在步骤s202中划分的某个划分语句中每一个分词构建新词;也可能只为在步骤s202中划分的某个划分语句中的若干分词分别构建新词。应理解到,分词和为该分词创建的新词之间存在对应关系,下文在描述中提到“相应分词”“相应新词”等表述都是基于该对应关系的描述。此外,可以理解到,对于一个分词,可能存在不止一个能表达其语义的新词。因此,一个分词可对应多个新词。
34.根据本技术的一些示例,在创建了新词之后,可将所创建的新词存储到新词记录中,每个新词被以关联到对应分词的方式存储。
35.在步骤s206,基于第二分隔方式下的各划分位置,以所创建的新词,创建多个划分语句的新语句。具体而言,每一个划分语句可因其分词对应多个新词而创建出多个新语句。在创建新语句时,可根据所记录的第二分割方式下的各划分位置,以对应具体划分语句的新词,去替代该划分语句中的相应分词。需要说明的是,根据本技术的示例,以新词替代相应分词,并不是要将具体划分语句中的分词同时全部以新词替代构造一个新语句,而是可以只替代该具体划分语句中的分词一个或多个分词从而构建出与该具体划分语句对应的多个新语句。
36.在步骤s208,基于第一分隔方式下的各划分位置,以新语句结合原始文本,创建与原始文本对应的隐写文本。基于第一分隔方式下的各划分位置,可定位到各划分语句在原始文本中的位置,从而以与划分语句相应的新语句替代该原始文本中该划分语句。对于创建了新语句的各划分语句而言,其可能包括一个或多个新语句;这样,对于原始文本的所有划分语句,则有更多的新语句。在构建隐写文本时,并不是要将所有划分语句同时以新语句替代,而是可以只替代一个或部分划分语句,从而构建出更多的隐写文本。
37.可根据需要的隐写文本的数量来创建隐写文本。举例来说,文本文本a包括段落而各段落包括一个或多个语句,图3示意了文本文件a按照本技术示例的可溯源的文本隐写方法隐写的过程。
38.同时参照图2和图3。将文本文件a划分(步骤s200)成10个划分语句,分别为划分语句1、划分语句2、划分语句3、......划分语句10。该示例中的第一分隔方式是按照标点符号划分,更为具体地,是按照句号划分。根据本技术的方法,在划分的过程中,记录每个划分位置。本例中,例如通过参考句号是文本文件a的第几个句号来记录划分位置,也就是按照句子在文本文件a中的顺序来记录划分位置。
39.在划分文本文件a时,可将文本文件a全篇依据第一分隔方式划分,也可只从中划分部分。例如,文本文件a全篇包括以句号断句的10句话,以句号划分出10个划分句便是划分了整篇文本文件a;可以只划分文本文件a的部分,例如只从文本文件a的10句中,将其中的5句作为划分语句。
40.回到图3,在将文本文件a全文划分成10个划分句的情况下,对其中的划分语句1、划分语句2和划分语句3,以第二分隔方式将它们分别划分(步骤s202)成多个分词。按照词性,划分语句1划分了3个分词,例如分词11、分词12、分词13;划分语句2划分了1个分词,即分词21;划分语句3划分了3个分词,例如分词31、分词32、分词33。记录第二分隔方式下的各划分位置,也就是记录好每个分词在划分语句中的位置,进而由划分语句的位置便可知道分词在文本文件a中的位置。对于文本文件a,共划分了7个分词。
41.本例中,为该7个分词分别从语义数据中索引(步骤s204)对应的新词。具体而言,为分词11索引新词11-1;为分词12索引新词12-1、新词12-2;为分词13索引新词13-1、新词13-2、新词13-3,为简洁起见,就不再一一列举针对分词21、分词31-33的新词。
42.根据本技术的示例,将索引的新词都保存到新词记录中,每个新词被以关联到相应分词的方式存储。也就是说,存储的新词13-3关联到分词13,新词13-2关联到新词13,新词12-1关联到分词12等等,该关联使得可从分词13索引到新词13-1、新词13-2、新词13-3以
及由任意一个新词关联到对应分词,例如由新词13-2索引到新词13。
43.需要说明的是,从语义数据库中“索引”新词指的是从语义数据库中查找到能表达分词语义的新词,并将找到的新词标注给该分词以便使用,例如本技术中便可以索引到的新词替代划分语句中的相应分词。
44.为划分语句1、划分语句2和划分语句3分别创建(s206)新语句。以划分语句1为例,它包括分词11、12和13,在创建新语句时,可以相应的新词替换划分语句1的分词11、分词12和分词13中的一个分词、二个分词,或全部分词。对于每一个划分语句,替换哪几个分词,以什么新词替代原分词从而构成新的句子,可根据需要生成的新语句的数量来随机选择要替换的分词和相应新词从而生成多个新语句。
45.在例如图3的例子中,划分语句1对应3个新语句,划分语句2对应1个新语句,划分语句对应5个新语句,如此,共为划分语句生成了9个新语句。
46.基于记录的划分位置,即句号在文本文件a中的位置,以该9个新语句结合原始文本a创建(步骤s208)隐写文本。可根据所需要的隐写文本的数量来设置创建方式。例如,需要6份隐写文本,便可从9个新语句中选取6个语义不同的新语句,分别以其中一个替代文本文件a中的相应划分语句,从而形成6份彼此不同的隐写文本。将每一个隐写文本与原文本文件a的不同记录到隐写记录中。
47.图4是根据本技术示例的文本文件信息泄露后的溯源方法的流程图。如图4所示,在步骤s400,将泄露的隐写文本与原始文本比较以确定两者的差别。在步骤s402,根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本的使用方信息,从而确定所泄露的隐写文本的原始使用方。使用方可以是接收方、文件请求方等。
48.根据本技术的示例,在结合图4描述的文本文件信息泄露后的溯源方法的示例中,隐写文本按照上文结合图1到图3所描述的任意一种可溯源的文本隐写方法创建。
49.例如,将原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的分隔位置。对多个划分语句中的每一个,以第二分隔方式将其划分成多个分词,并记录第二分隔方式下的分隔位置。从语义数据库为多个分词中的每一个索引一个或多个新词。将新词以与相应分词关联的方式,存储到新词记录中。可根据隐写文本请求,从新词记录中获取新词并基于第二分隔方式下的各划分位置,创建多个划分语句的新语句。基于第一分隔方式下的各划分位置,以新语句结合原始文本创建与原始文本对应的隐写文本,且所创建的隐写文本之间以及所创建的隐写文本与先前已经创建的隐写文本(如果由已经创建的隐写文本的话)存在不同。将本次创建的隐写文本与原始文本的差别,存储到隐写记录。同时,可将该隐写文本的使用方(例如隐写文本请求方等)的信息也记录的隐写记录中。
50.根据本技术的各示例的可溯源的文本隐写方法,在任意一个隐写文本泄露后,可通过比较隐写文本与原始文本的差别,据此差别从隐写记录确定是哪个隐写文本被泄露,且在隐写记录包括使用方信息的情况下可据此确定到使用方,如此,便实现了对该隐写文本溯源,有助于确定泄露情况。
51.申请示例的方法是基于自然语义技术为原语句生成新语句,将新语句结合到原始文本文件中。由此,各隐写文本彼此不同又未改变原始文本的语义,对接收方了解传递的信息内容而言,几乎没有影响,但由于隐写文本彼此不同,且各隐写文本与原始文本的差异又被记录,所以可达到水印所需要的溯源效果而又不影响文本阅读。进一步,根据本技术的可
溯源的文本隐写方法不受载体影响,因此不会因载体异常而消失。
52.根据本技术示例的各方法,可以通过软件或硬件与软件结合的方式实现。例如,通过程序指令将根据本技术示例的方法编程为程序模块,从而在包括处理器的电子设备中执行。所实现的程序指令可以存储在用于执行根据本技术示例的各方法的电子设备的存储器中,也可单独存储但该单独存储的存储器可与该电子设备连接以便后者读取指令。
53.图5是根据本技术示例的文本文件管理方法的流程图。在步骤s500,根据对文本文件的请求,创建隐写文本。可根据上文描述的任一示例的可溯源的文本隐写方法来创建隐写文本。在步骤s502,将创建的隐写文件发送给文件请求方,并在所述隐写记录中记录与请求方有关的信息。如此,便在不影响文件内容阅读且能传递与原始文本相同内容的情况下,实现对文本文件的有效管理,
54.图6是根据本技术示例的可溯源的文本隐写系统的结构示意图。如图所示,该隐写系统6包括第一单元60、第二单元62、第三单元64以及存储单元66。第一单元60用于对原始文本进行语句划分,从而形成多个划分语句。第二单元62用于基于语义数据库,为多个划分语句中的每一个或部分创建能表达原语义的新语句。第三单元64用于以所创建的新语句结合原始文本创建与原始文本对应的隐写文本,且各隐写文本彼此不同。存储单元66用于存储隐写记录,隐写记录包括所记录的各隐写文本与原始文本的差别。
55.根据本技术的一些示例,第一单元60设置为将所述原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的各划分位置。第一单元60进一步设置为对所述多个划分语句中的至少一个划分语句,以第二分隔方式将其划分成多个分词,并记录第二分隔方式下的各划分位置。第二单元62设置为从语义数据库为所述多个分词中的每一个索引一个或多个新词。在未能索引到新词的情况下,可将原分词作为相应的新词,是否一定要为每个分词索引一个新词,这取决于实际需要。以索引的新词和所述第二分隔方式下的各划分位置创建所述多个划分语句的新语句。第三单元64设置为基于所述第一分隔方式下的各划分位置,以新语句结合原始文本创建与原始文本对应的隐写文本。在进一步的示例中,第二单元62还设置为将新词以与相应分词关联的方式存储到新词记录中。
56.图6所示的系统可用来执行上文各示例的可溯源的文本隐写方法。例如,由第一单元60执行步骤s100、由第二单元62执行步骤s102、由第三单元执行步骤s104、由存储单元64存储隐写记录等。
57.图7是根据本技术示例的本文件信息泄露后的溯源系统的结构示意图。如图7所示,该系统包括比较单元70、接收方确定单元72。比较单元70用于将泄露的隐写文本与原始文本比较以确定两者的差别。接收方确定单元72用于根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本接收方,从而确定所泄露的隐写文本的原始接收方。隐写文本是由根据图6所示的系统创建的,或者根据上文描述的可溯源的文本隐写方法创建的。
58.此外,根据本技术的各例中,还包括对验证所索引的新词。具体而言,对于根据本技术各示例的可溯源的文本隐写方法,验证所索引的新词是否能表达相应分词的语义,且仅在通过验证的情况下,将所索引的新词存储到所述新词记录中。该验证可通过预设的验证模型来进行,例如基于大数据确定该新词是否表达分词的语义,或将新词输出由人工确定是否符合分词语义等。对于本技术示例的可溯源的文本隐写系统,则可包括验证单元,用于验证所索引的新词是否能表达相应分词的语义,且仅在验证通过的情况下,使所索引的
新词存储到所述新词记录中。通过验证,可进一步确保所索引的新词能表达相应分词语义。
59.根据本技术示例的文本隐写系统,其中的第一、第二和第三单元可由模块实现,例如结合到硬件中的软件模块。具体而言,各单元可实现为软件模块,结合到处理器中。由此,文本隐写系统由该处理器与作为存储单元的存储器实现。
60.还提供一种电子设备,其包括处理器和存储器,所述存储器存储指令,所述处理器配置能处理所述指令且在执行所述指令时能实现根据上文所述的任意一种可溯源的文本隐写方法。
61.还提供一种计算机可读存储介质,所述存储介质用于存储指令,所述存储指令在被执行时,能实现根据上文所述的任意一种可溯源的文本隐写方法。该存储介质例如为非暂存存储介质。
62.虽然已详细地示出并描述了本技术的具体实施例以说明本技术的原理,但应理解的是,本技术可以其它方式实施而不脱离这样的原理。
技术特征:
1.一种可溯源的文本隐写方法,其特征在于,所述方法包括:对原始文本进行语句划分以形成多个划分语句;基于语义数据库,为所述多个划分语句中的每一句或部分语句创建能表达原语义的新语句;以所创建的新语句结合所述原始文本创建与原始文本对应的隐写文本,所述隐写文本彼此不同;以及将每一个所述隐写文本与所述原始文本的差别记录到隐写记录。2.根据权利要求1所述的文本隐写方法,其特征在于,所述对原始文本进行语句划分,包括:将所述原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的各划分位置。3.根据权利要求2所述的文本隐写方法,其特征在于,所述对原始文本进行语句划分,还包括:以第二分隔方式将所述多个划分语句中的至少一个划分语句划分成多个分词,并记录第二分隔方式下的各划分位置。4.根据权利要求3所述的文本隐写方法,其特征在于,所述基于语义数据库,为所述多个划分语句中的每一句或部分语句创建能表达原语义的新语句,包括:从语义数据库为所述多个分词中的每一个或部分分词索引一个或多个新词;以所述新词并基于所述第二分隔方式下的各划分位置,创建所述多个划分语句的新语句;以及所述以所创建的新语句结合所述原始文本创建与原始文本对应的隐写文本,包括:基于所述第一分隔方式下的各划分位置,以所述新语句结合所述原始文本创建多个与原始文本对应的隐写文本。5.根据权利要求4所述的文本隐写方法,其特征在于,所述方法还包括:在语义数据库为所述多个分词中的每一个索引一个或多个新词后,将所索引的新词以与相应分词关联的方式存储到新词记录中。6.根据权利要求4或5所述的文本隐写方法,其特征在于,所述方法还包括:验证所索引的新词是否能表达所述相应分词的语义,且仅在通过验证的情况下,将所索引的新词存储到所述新词记录中。7.根据权利要求2或3所述的文本隐写方法,其特征在于,所述第一分隔方式包括以下方式中的一种或多种:按照标点分隔的方式;按照谓语分隔的方式;按照表达意思完整度分隔的方式。8.根据权利要求7所述的文本隐写方法,其特征在于,所述第二分隔方式是按照词性分隔。9.一种文本文件信息泄露后的溯源方法,其特征在于,所述方法包括:将泄露的隐写文本与原始文本比较以确定两者的差别;根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本使用方信息;
其中,所述隐写文本根据权利要求1到权利要求8中任意一项所述的文本隐写方法创建;以及其中,所述隐写记录还包括各隐写文本的使用方信息。10.一种文本文件管理方法,其特征在于,所述方法包括:根据对文本文件的请求,按照权利要求1到权利要求8中任意一项所述的方法创建所请求的文本文件的隐写文本;将所述隐写文本作为所请求的文件发送给文件请求方,并在所述隐写记录中记录文件请求方信息。11.一种可溯源的文本隐写系统,其特征在于,所述系统包括:第一单元,用于对原始文本进行语句划分以形成多个划分语句;第二单元,用于基于语义数据库,为所述多个划分语句中的每一句或部分语句创建能表达原语义的新语句;第三单元,用于以所创建的新语句结合所述原始文本创建与所述原始文本对应的隐写文本,各所述隐写文本彼此不同;存储单元,用于存储隐写记录,所述隐写记录包括所记录的各所述隐写文本与所述原始文本的差别。12.根据权利要求11所述的文本隐写系统,其特征在于,所述第一单元设置为:将所述原始文本按照第一分隔方式划分成多个划分语句,并记录第一分隔方式下的各划分位置;以第二分隔方式将所述多个划分语句中的至少一个划分语句划分成多个分词,并记录第二分隔方式下的各划分位置。13.根据权利要求12所述的文本隐写系统,其特征在于,所述第二单元设置为:从语义数据库为所述多个分词中的每一个索引一个或多个新词;以所述新词并基于所述第二分隔方式下的各划分位置,创建所述多个划分语句的新语句;以及所述第三单元设置为基于所述第一分隔方式下的各划分位置,以所述新语句结合所述原始文本创建多个与原始文本对应的隐写文本。14.根据权利要求13所述的文本隐写系统,其特征在于,所述第二单元还设置为将将所索引的新词以与相应分词关联的方式存储到新词记录中。15.一种文本文件信息泄露后的溯源系统,其特征在于,所述系统包括:比较单元,用于将泄露的隐写文本与原始文本比较以确定两者的差别;使用方确定单元,用于根据所确定的差别,从隐写记录中查找与该差别对应的隐写文本使用方信息;其中,所述隐写文本是根据权利要求1到权利要求8中任意一项所述的方法创建的隐写文本,或所述隐写文本是由权利要求11到权利要求14中任意一项所述的系统创建的隐写文本。16.一种电子设备,其包括处理器和存储器,所述存储器存储指令,所述处理器配置能处理所述指令且在执行所述指令时能实现根据权利要求1到权利要求8中任意一项所述的方法。
17.一种计算机可读存储介质,所述存储介质用于存储指令,所述存储指令在被执行时,能实现根据权利要求1到权利要求8中任意一项所述的方法。
技术总结
本申请提供可溯源的文本隐写方法,包括对原始文本进行语句划分,从而形成多个划分语句;基于语义数据库,为所述多个划分语句中的每一个或部分创建能表达原语义的新语句;以所创建的新语句结合所述原始文本创建多个与原始文本对应的隐写文本,各所述隐写文本彼此不同;将各所述隐写文本与所述原始文本的差别记录到隐写记录中。还提供文本文件信息泄露后的溯源方法及相应的系统。溯源方法及相应的系统。溯源方法及相应的系统。
技术研发人员:车堃 张辉
受保护的技术使用者:证通股份有限公司
技术研发日:2023.06.07
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/