一种合同文本智能审核系统的制作方法
未命名
09-27
阅读:66
评论:0
1.本发明涉及合同文本技术领域,具体为一种合同文本智能审核系统。
背景技术:
2.合同文本智能审核系统是用于审核合同文本的系统,合同文本智能审核系统都是通过人工对合同文本中的错字和措辞等错误进行纠正,无法对合同进行自动审核,导致合同文本智能审核系统在使用时需要大量的人工进行检测,从而增加了操作者的劳动力。
技术实现要素:
3.为解决上述背景技术中提出的问题,本发明的目的在于提供一种合同文本智能审核系统,具备可以对合同进行自动审核的优点,解决了合同文本智能审核系统无法对合同进行自动审核的问题。
4.为实现上述目的,本发明提供如下技术方案:一种合同文本智能审核系统,包括数据采集处理单元,所述数据采集处理单元的输出端电连接有知识库单元,所述知识库单元的输出端电连接有文本读取单元,所述文本读取单元的输出端电连接有规则库单元,所述规则库单元的输出端电连接有流程系统,所述流程系统包括分词单元、纠错单元和对比单元,所述流程系统的输出端电连接有核验单元,所述核验单元的输出端电连接有显示单元。
5.将合同原始文本放入数据采集处理单元的内部,通过数据采集处理单元将先前数据进行格式化清理,数据采集处理单元对合同原始文本内部的数据进行收集,数据采集处理单元将数据传入知识库单元,通过法保网知识图谱和法保网专用词典,实现打标数据仓库中的数据,输入到算法里,利用transform模型+crf对数据预训练,进行提取语义特征并生成向量且用crf\进行约束,形成提取关系和三元组抽取,提取关系是知识图谱的边,首先进行语句解析,通过生成语句的句法分析树,可以获得语句的词法信息和局发信息,通过语句的特定结构获得语句的语义信息,三元组抽取,用keras做三元组抽取,一种基于半指针-半标注的方式来抽取,整体架构为bert,抽取顺序为先抽s再抽o,然后根据so抽p,法保网专用词典,用于实体统一以及指代消解,知识库单元将数据传入文本读取单元的内部,通过文本读取单元中的文本统计软件和法保网app在线编辑系统,可以将数据生成字符串,列表数据规则库单元使用,通过规则库单元将数据传入流程系统的内部,通过流程系统对分词单元、纠错单元和对比单元对数据进行纠错,再将分词单元、纠错单元和对比单元将合同的错误处标出,同时将数据传入核验单元对数据进行二次审核,完成后,核验单元将数据传入显示单元的内部,通过显示单元对数据进行显示。
6.作为本发明优选的,所述知识库单元包括法保网知识图谱和法保网专用词典,所述知识库单元为u盘。
7.作为本发明优选的,所述文本读取单元包括文本统计软件和法保网app在线编辑系统,所述法保网app在线编辑系统为键盘和鼠标。
8.作为本发明优选的,所述分词单元为jieba分词,所述规则库单元为固态硬盘。
9.作为本发明优选的,所述知识库单元为固态硬盘,所述规则库单元为移动硬盘。
10.作为本发明优选的,所述显示单元为显示屏,所述显示单元的输入端电连接有供电电源。
11.与现有技术相比,本发明的有益效果如下:1、本发明通过设置流程系统,对合同中的错字和措辞等错误进行检测,从而达到了可以对合同进行自动审核的效果,解决了合同文本智能审核系统无法对合同进行自动审核的问题,具备可以对合同进行自动审核的优点,合同文本智能审核系统在使用时不需要大量的人工进行检测,从而节省了操作者的劳动力。
12.2、本发明通过设置法保网知识图谱和法保网专用词典,可以打标数据仓库中的数据,输入到算法里,利用transform模型+crf对数据预训练,进行提取语义特征并生成向量且用crf\进行约束。
13.3、本发明通过设置文本统计软件和法保网app在线编辑系统,可以将公司的数据输入到合同中,使文本读取单元会生成字符串,或者列表或者dict类型数据供流程单元使用。
14.4、本发明通过设置jieba分词,可以使分词单元依赖于法保网专用词典,对文本读取单元处理后的数据进行分词处理,分词处理之后暂存于list和dict的内部,dict负责统计词频并供词典构建时使用。
15.5、本发明通过设置知识库单元为固态硬盘,可以储存大量的数据,通过设置规则库单元为移动硬盘,可以对内部的数据进行更换和更新。
16.6、本发明通过设置显示单元为显示屏,可以显示合同内容,同时显示合同上的错误,通过设置供电电源,可以对显示单元进行供电。
附图说明
17.图1为本发明系统图;图2为本发明图1的数据转换系统图;图3为本发明图1的工作原理系统图。
具体实施方式
18.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
19.如图1至图3所示,本发明提供的一种合同文本智能审核系统,包括数据采集处理单元,数据采集处理单元的输出端电连接有知识库单元,知识库单元的输出端电连接有文本读取单元,文本读取单元的输出端电连接有规则库单元,规则库单元的输出端电连接有流程系统,流程系统包括分词单元、纠错单元和对比单元,流程系统的输出端电连接有核验单元,核验单元的输出端电连接有显示单元。
20.参考图1,知识库单元包括法保网知识图谱和法保网专用词典,知识库单元为u盘。
21.作为本发明的一种技术优化方案,通过设置法保网知识图谱和法保网专用词典,
可以打标数据仓库中的数据,输入到算法里,利用transform模型+crf对数据预训练,进行提取语义特征并生成向量且用crf\进行约束。
22.参考图1,文本读取单元包括文本统计软件和法保网app在线编辑系统,法保网app在线编辑系统为键盘和鼠标。
23.作为本发明的一种技术优化方案,通过设置文本统计软件和法保网app在线编辑系统,可以将公司的数据输入到合同中,使文本读取单元会生成字符串,或者列表或者dict类型数据供流程单元使用。
24.参考图1,分词单元为jieba分词,规则库单元为固态硬盘。
25.作为本发明的一种技术优化方案,通过设置jieba分词,可以使分词单元依赖于法保网专用词典,对文本读取单元处理后的数据进行分词处理,分词处理之后暂存于list和dict的内部,dict负责统计词频并供词典构建时使用。
26.参考图1,知识库单元为固态硬盘,规则库单元为移动硬盘。
27.作为本发明的一种技术优化方案,通过设置知识库单元为固态硬盘,可以储存大量的数据,通过设置规则库单元为移动硬盘,可以对内部的数据进行更换和更新。
28.参考图1,显示单元为显示屏,显示单元的输入端电连接有供电电源。
29.作为本发明的一种技术优化方案,通过设置显示单元为显示屏,可以显示合同内容,同时显示合同上的错误,通过设置供电电源,可以对显示单元进行供电。
30.本发明的操作者将合同原始文本放入数据采集处理单元的内部,通过数据采集处理单元将先前数据进行格式化清理,数据采集处理单元对合同原始文本内部的数据进行收集,数据采集处理单元将数据传入知识库单元,通过法保网知识图谱和法保网专用词典,实现打标数据仓库中的数据,输入到算法里,利用transform模型+crf对数据预训练,进行提取语义特征并生成向量且用crf\进行约束,形成提取关系和三元组抽取,提取关系是知识图谱的边,首先进行语句解析,通过生成语句的句法分析树,可以获得语句的词法信息和局发信息,通过语句的特定结构获得语句的语义信息,三元组抽取,用keras做三元组抽取,一种基于半指针-半标注的方式来抽取,整体架构为bert,抽取顺序为先抽s再抽o,然后根据so抽p,法保网专用词典,用于实体统一以及指代消解,知识库单元将数据传入文本读取单元的内部,通过文本读取单元中的文本统计软件和法保网app在线编辑系统,可以将数据生成字符串,列表数据规则库单元使用,通过规则库单元将数据传入流程系统的内部,通过流程系统对分词单元、纠错单元和对比单元对数据进行纠错,再将分词单元、纠错单元和对比单元将合同的错误处标出,同时将数据传入核验单元对数据进行二次审核,完成后,核验单元将数据传入显示单元的内部,通过显示单元对数据进行显示,从而达到了可以对合同进行自动审核的效果。
31.需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。
32.尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以
理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。
技术特征:
1.一种合同文本智能审核系统,包括数据采集处理单元,其特征在于:所述数据采集处理单元的输出端电连接有知识库单元,所述知识库单元的输出端电连接有文本读取单元,所述文本读取单元的输出端电连接有规则库单元,所述规则库单元的输出端电连接有流程系统,所述流程系统包括分词单元、纠错单元和对比单元,所述流程系统的输出端电连接有核验单元,所述核验单元的输出端电连接有显示单元;将合同原始文本放入数据采集处理单元的内部,通过数据采集处理单元将先前数据进行格式化清理,数据采集处理单元对合同原始文本内部的数据进行收集,数据采集处理单元将数据传入知识库单元,通过法保网知识图谱和法保网专用词典,实现打标数据仓库中的数据,输入到算法里,利用transform模型+crf对数据预训练,进行提取语义特征并生成向量且用crf\进行约束,形成提取关系和三元组抽取,提取关系是知识图谱的边,首先进行语句解析,通过生成语句的句法分析树,可以获得语句的词法信息和局发信息,通过语句的特定结构获得语句的语义信息,三元组抽取,用keras做三元组抽取,一种基于半指针-半标注的方式来抽取,整体架构为bert,抽取顺序为先抽s再抽o,然后根据so抽p,法保网专用词典,用于实体统一以及指代消解,知识库单元将数据传入文本读取单元的内部,通过文本读取单元中的文本统计软件和法保网app在线编辑系统,可以将数据生成字符串,列表数据规则库单元使用,通过规则库单元将数据传入流程系统的内部,通过流程系统对分词单元、纠错单元和对比单元对数据进行纠错,再将分词单元、纠错单元和对比单元将合同的错误处标出,同时将数据传入核验单元对数据进行二次审核,完成后,核验单元将数据传入显示单元的内部,通过显示单元对数据进行显示。2.根据权利要求1所述的一种合同文本智能审核系统,其特征在于:所述知识库单元包括法保网知识图谱和法保网专用词典,所述知识库单元为u盘。3.根据权利要求2所述的一种合同文本智能审核系统,其特征在于:所述文本读取单元包括文本统计软件和法保网app在线编辑系统,所述法保网app在线编辑系统为键盘和鼠标。4.根据权利要求3所述的一种合同文本智能审核系统,其特征在于:所述分词单元为jieba分词,所述规则库单元为固态硬盘。5.根据权利要求4所述的一种合同文本智能审核系统,其特征在于:所述知识库单元为固态硬盘,所述规则库单元为移动硬盘。6.根据权利要求5所述的一种合同文本智能审核系统,其特征在于:所述显示单元为显示屏,所述显示单元的输入端电连接有供电电源。
技术总结
本发明公开了一种合同文本智能审核系统,包括数据采集处理单元,所述数据采集处理单元的输出端电连接有知识库单元,所述知识库单元的输出端电连接有文本读取单元,所述文本读取单元的输出端电连接有规则库单元,规则库单元的输出端电连接有流程系统,流程系统包括分词单元、纠错单元和对比单元。本发明通过设置流程系统,对合同中的错字和措辞等错误进行检测,从而达到了可以对合同进行自动审核的效果,解决了合同文本智能审核系统无法对合同进行自动审核的问题,具备可以对合同进行自动审核的优点,合同文本智能审核系统在使用时不需要大量的人工进行检测,从而节省了操作者的劳动力。动力。动力。
技术研发人员:华涛
受保护的技术使用者:浙江法之道信息技术有限公司
技术研发日:2022.03.08
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/