一种司法诉讼风险预测方法、装置、设备及存储介质与流程
未命名
09-29
阅读:58
评论:0
1.本发明涉及诉讼风险预测领域,特别涉及一种司法诉讼风险预测方法、装置、设备及存储介质。
背景技术:
2.当前,众多学者利用ai(artificial intelligence,人工智能)技术对法律诉讼风险进行相关的研究,部分学者利用裁判文书并结合数据挖掘技术和机器学习算法,建立一个涉诉风险预警模型,对判决书进行风险评估和预测,从而提供智能化支持。同时,ai在法律问答、信息处理、文书制作、类案推送、案件分析、辅助裁判等方面的都有一定的作用和挑战,可以利用各种舆情获取技术对其进行分析,但对于司法诉讼风险预测的研究技术相对比较单一。
3.司法诉讼风险通常是一些企业的连锁反映状态,比如a企业如果发生重大司法案件,则相关的投资方对其进行起诉的可能性就会变高;另外,通常能披露的数据往往是上市公司的数据,其关联的通常是无披露数据的中小微企业。因此,传统的机器学习通常针对独立的单一个体进行风险的捕捉与预警,通常会筛选出该企业的众多风险特征,但很难利用其本身的特征,判别其是否存在风险。
技术实现要素:
4.有鉴于此,本发明的目的在于提供一种司法诉讼风险预测方法、装置、设备及存储介质,能够通过关系图谱刻画不同企业之间的关联关系,并通过关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,实现对企业司法诉讼风险的有效预测。其具体方案如下:第一方面,本技术提供了一种司法诉讼风险预测方法,包括:获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
5.可选的,所述获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注,包括:获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。
6.可选的,所述关联关系包括投资股权关系和担保关系。
7.可选的,所述获取若干企业的数据,包括:获取若干企业的基本信息、征信数据和司法数据。
8.可选的,所述获取若干企业的数据之后,还包括:对所述若干企业的数据中的数值型数据进行归一化;和/或,对所述若干企业的数据中的类别型数据进行编码。
9.可选的,所述利用所述关系图谱对初始关系图卷积网络进行训练之前,还包括:对所述关系图谱中不存在征信数据和司法数据的企业进行剔除;和/或,对所述关系图谱中不存在关联关系的企业进行剔除。
10.可选的,所述利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,包括:通过所述目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到所述待检测企业的向量表示;通过所述目标关系图卷积网络中的解码器并利用打分函数对所述待检测企业的向量表示进行司法诉讼风险预测,以得到所述待检测企业的预测概率。
11.第二方面,本技术提供了一种司法诉讼风险预测装置,包括:司法诉讼标注模块,用于获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;关系图谱构建模块,用于基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;网络训练模块,用于利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;诉讼风险预测模块,用于利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
12.第三方面,本技术提供了一种电子设备,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序以实现前述的司法诉讼风险预测方法。
13.第四方面,本技术提供了一种计算机可读存储介质,用于保存计算机程序,所述计算机程序被处理器执行时实现前述的司法诉讼风险预测方法。
14.本技术中,获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。由此可见,本技术通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以
及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
附图说明
15.为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据提供的附图获得其他的附图。
16.图1为本技术公开的一种司法诉讼风险预测方法流程图;图2为本技术公开的一种关系图谱示意图;图3为本技术公开的一种司法诉讼风险预测流程图;图4为本技术公开的一种司法诉讼风险预测装置结构示意图;图5为本技术公开的一种电子设备结构图。
具体实施方式
17.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
18.传统的机器学习通常针对独立的单一个体进行风险的捕捉与预警,通常会筛选出该企业的众多风险特征,但很难利用其本身的特征,判别其是否存在风险。为此,本技术提供了一种司法诉讼风险预测方法,能够通过关系图谱刻画不同企业之间的关联关系,并通过关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,实现对企业司法诉讼风险的有效预测。
19.参见图1所示,本发明实施例公开了一种司法诉讼风险预测方法,包括:步骤s11、获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注。
20.本实施例中,获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注,包括:获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。其中,第二历史时间段为最近一个月的时间,第一历史时间段为最近一个月之前的两年时间。具体的,通过从历史案例、法律文书、新闻报道等多种数据源获取最近一个月之前的两年时间内的若干企业的数据,并对最近一个月内的若干企业的裁判文书进行采集。由于公开数据源中一般只记录了大企业的信息,因此能采集到裁判文书的只有少量企业,例如,获取第一历史时间段内约100万个企业的数据,在第二历史时间段内能采集到裁判文书的企业只有10万个左右。然后基于采集到的裁判文书对若干企业中相应的少量企业进行是否发生司法诉讼的标注,若发生司法诉讼,则标注为1;若未发生司法诉讼,则标注为0。其中,司法诉讼包括但不限于经济诉讼。
21.本实施例中,所述获取若干企业的数据,包括:获取若干企业的基本信息、征信数据和司法数据,然后对若干企业的数据中的数值型数据进行归一化;以及对若干企业的数据中的类别型数据进行编码。通过将数值型数据进行归一化以及将类别型数据进行编码,以便于后续用于关系图卷积网络进行学习。其中,对于若干企业的基本信息,是不会随着时间的变化而变化的,主要包括企业所在省份、注册资本、行业规模、行业类型等。对于若干企业的征信数据和司法数据,一般指的是企业在不同时间区间具有当前时间特点的数据,往往在不同时间点会发生某些变化,是具有一定的周期规律或自身特点的波动规律的数据。
22.本实施例中,企业的征信数据和司法数据包括企业不同时间点的变更信息、企业财务信息、企业软件著作权\专利信息、企业贷款信息、企业征信信息、企业负面舆情信息、企业被执行人信息、企业欠税以及税务违法信息、企业严重违规信息、企业历年来发生的司法诉讼信息、企业限制高消费信息等。其中,企业不同时间点的变更信息包括不同时间区间的变更次数、变更性质等,通常无故频繁变更的企业存在极高的法律诉讼风险。企业财务信息包括不同时间区间内企业的盈利额、亏损额、收益率等能反映企业财务状况或间接反映是否存在财务风险的指标。企业软件著作权\专利信息可以反映企业是否存在知识产权类的经济纠纷,通常情况下,相互合作的企业共享某些类似的专利技术时容易发生司法纠纷。企业欠税以及税务违法信息包括虚开发票、恶意逃税等行为,税务违法的企业通常容易产生相关的司法诉讼。企业严重违规信息包括违反劳动法等行为,这些行为容易产生司法诉讼。企业历年来发生的司法诉讼信息包括历年的司法诉讼数量、性质、类型等,通常认为企业历史上发生诉讼数量越多,则未来发生诉讼可能性也越大。企业限制高消费信息包括企业是否存在被司法机关限制高消费等行为。企业负面舆情信息主要包括企业重大负面舆情数量、类型、舆情发生时间、舆情性质等。
23.步骤s12、基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱。
24.本实施例中,所述关联关系包括投资股权关系和担保关系,一般情况下,不同企业之间的经济纠纷,与企业自身的风险存在很大的关系,例如,如果a企业发生重大司法案件,则相关的投资方对其进行起诉的可能性就会变高。具体的,可以按照预设比例,例如7:3,将所有的已标注企业划分为训练集和验证集。由于具有裁判文书的企业只是少部分企业,因此对于关系图卷积网络(r-gcn,relational graph convolutional network)的训练采用半监督训练,也即基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各个企业之间的关联关系构建关系图谱,以作为训练集。图2即为一个关系图谱,其中,带斜线的圆圈表示存在司法诉讼的企业,带点的圆圈表示不存在司法诉讼的企业,各圆圈之间的边表示各个企业之间的关联关系。
25.步骤s13、利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络。
26.本实施例中,在利用关系图谱对初始关系图卷积网络进行训练之前,还包括:对关系图谱中不存在征信数据和司法数据的企业进行剔除;以及对关系图谱中不存在关联关系的企业进行剔除。可以理解的是,由于只具有基本信息的企业不具有参考性,例如,该企业只具有企业名称,因此可以将这些企业进行剔除;另外,对于不存在关联关系的企业也不具有参考性,需要将这些企业也进行剔除,从而得到新的关系图谱。然后利用关系图谱对初始
关系图卷积网络进行半监督训练,并利用验证集对训练得到的关系图卷积网络进行验证,以选取具有最优参数的目标关系图卷积网络。
27.步骤s14、利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
28.本实施例中,利用目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,包括:通过目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到待检测企业的向量表示;通过目标关系图卷积网络中的解码器并利用打分函数对待检测企业的向量表示进行司法诉讼风险预测,以得到待检测企业的预测概率。可以理解的是,编码器使用图卷积层结合待检测企业的数据,可以生成待检测企业的向量表示;解码器使用打分函数可以对待检测企业的向量表示进行司法诉讼风险的预测,以得到预测概率。例如,如果利用目标关系图卷积网络对图2中的a企业和b企业进行司法诉讼风险预测,由于a节点(企业)和b节点(企业)均会聚合周边节点的特征、关联关系以及邻居节点的邻居特征,最后对于a企业发生司法诉讼风险的预测概率会明显大于b企业。进一步的,通过设置一个概率阈值,例如0.6,当预测概率大于0.6时,则表明待检测企业极有可能发生司法诉讼风险但目前尚未发生,也即可以将待检测企业判定为高风险企业。其中,目标关系图卷积网络中涉及到的聚合函数公式如下:;需要说明的是,h表示神经网络隐藏层;表示激活函数;r表示关系;r表示关系集合;j表示节点i的邻居节点;表示节点i的关系为r的邻居节点集合;是一个正则化常量,其中的取值为;是线性转化函数,用于将同类型边的邻居节点,使用一个参数矩阵进行转化;表示节点i的第层节点表示;表示节点i的第层节点表示;表示节点i的邻居节点的第层节点表示;表示自身节点的特征权重矩阵。
29.由此可见,本技术通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
30.参见图3所示,本发明实施例公开了一种司法诉讼风险预测方法,包括:获取最近一个月之前的两年时间内的若干企业的数据,并对最近一个月内的若干企业的裁判文书进行采集。利用专家规则并基于采集到的裁判文书对若干企业中相应的部分企业进行是否发生司法诉讼的标注,若发生司法诉讼,则标注为1;若未发生司法诉讼,则标注为0。然后利用特征工程对若干企业的数据中的数值型数据进行归一化,以及对若干企业的数据中的类别型数据进行编码。按照7:3的比例将所有已标注企业划分为训练集和验证集,对于训练集的构建,基于若干已标注企业的数据以及对应的标签、若干未标注企业的
数据以及各个企业之间的关联关系构建关系图谱,从而利用关系图谱对初始r-gcn进行半监督训练,并利用验证集对训练得到的r-gcn进行验证和评估,以选择具有最优参数的r-gcn作为目标r-gcn。
31.在得到目标r-gcn之后,利用目标r-gcn对待检测企业的数据以及与其他企业之间的关联关系进行司法诉讼风险预测,以得到待检测企业的预测概率。若预测概率大于预设概率阈值,则表明待检测企业发生司法诉讼的风险较高,也即待检测企业为高风险企业,然后可以将待检测企业存储到数据库中,从而方便用户查看高风险企业的信息。
32.由此可见,本技术通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
33.参见图4所示,本发明实施例公开了一种司法诉讼风险预测装置,包括:司法诉讼标注模块11,用于获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;关系图谱构建模块12,用于基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;网络训练模块13,用于利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;诉讼风险预测模块14,用于利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。
34.由此可见,本技术通过对大量企业的数据进行采集、标注和分析,基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据构建关系谱图,以刻画不同企业之间的关联关系;然后利用关系图谱对初始关系图卷积网络进行半监督训练,从而建立更准确、更可靠的目标关系图卷积网络;通过目标关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,可以实现对待检测企业的司法诉讼风险的有效预测。
35.在一些具体实施例中,所述司法诉讼标注模块11,具体可以包括:裁判文书采集单元,用于获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;司法诉讼标注单元,用于基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。
36.在一些具体实施例中,所述司法诉讼标注模块11,具体可以包括:数据获取单元,用于获取若干企业的基本信息、征信数据和司法数据。
37.在一些具体实施例中,所述司法诉讼风险预测装置,还可以包括:数据归一化单元,用于对所述若干企业的数据中的数值型数据进行归一化;数据编码单元,用于对所述若干企业的数据中的类别型数据进行编码。
38.在一些具体实施例中,所述司法诉讼风险预测装置,还可以包括:
第一企业剔除单元,用于对所述关系图谱中不存在征信数据和司法数据的企业进行剔除;第二企业剔除单元,用于对所述关系图谱中不存在关联关系的企业进行剔除。
39.在一些具体实施例中,所述诉讼风险预测模块14,具体可以包括:特征向量提取单元,用于通过所述目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到所述待检测企业的向量表示;诉讼风险预测单元,用于通过所述目标关系图卷积网络中的解码器并利用打分函数对所述待检测企业的向量表示进行司法诉讼风险预测,以得到所述待检测企业的预测概率。
40.进一步的,本技术实施例还公开了一种电子设备,图5是根据一示例性实施例示出的电子设备20结构图,图中的内容不能认为是对本技术的使用范围的任何限制。
41.图5为本技术实施例提供的一种电子设备20的结构示意图。该电子设备 20,具体可以包括:至少一个处理器21、至少一个存储器22、电源23、通信接口24、输入输出接口25和通信总线26。其中,所述存储器22用于存储计算机程序,所述计算机程序由所述处理器21加载并执行,以实现前述任一实施例公开的司法诉讼风险预测方法中的相关步骤。另外,本实施例中的电子设备20具体可以为电子计算机。
42.本实施例中,电源23用于为电子设备20上的各硬件设备提供工作电压;通信接口24能够为电子设备20创建与外界设备之间的数据传输通道,其所遵 循的通信协议是能够适用于本技术技术方案的任意通信协议,在此不对其进 行具体限定;输入输出接口25,用于获取外界输入数据或向外界输出数据,其具体的接口类型可以根据具体应用需要进行选取,在此不进行具体限定。
43.另外,存储器22作为资源存储的载体,可以是只读存储器、随机存储器、 磁盘或者光盘等,其上所存储的资源可以包括操作系统221、计算机程序222 等,存储方式可以是短暂存储或者永久存储。
44.其中,操作系统221用于管理与控制电子设备20上的各硬件设备以及计算 机程序222,其可以是windows server、netware、unix、linux等。计算机程序222除了包括能够用于完成前述任一实施例公开的由电子设备20执行的司法诉讼风险预测方法的计算机程序之外,还可以进一步包括能够用于完成其他特定工作的计算机程序。
45.进一步的,本技术还公开了一种计算机可读存储介质,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现前述公开的司法诉讼风险预测方法。关于该方法的具体步骤可以参考前述实施例中公开的相应内容,在此不再进行赘述。
46.本说明书中各个实施例采用递进的方式描述,每个实施例重点说明的都是与其它实施例的不同之处,各个实施例之间相同或相似部分互相参见即可。对于实施例公开的装置而言,由于其与实施例公开的方法相对应,所以描述的比较简单,相关之处参见方法部分说明即可。
47.专业人员还可以进一步意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业
技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
48.结合本文中所公开的实施例描述的方法或算法的步骤可以直接用硬件、处理器执行的软件模块,或者二者的结合来实施。软件模块可以置于随机存储器(ram)、内存、只读存储器(rom)、电可编程rom、电可擦除可编程rom、寄存器、硬盘、可移动磁盘、cd-rom、或技术领域内所公知的任意其它形式的存储介质中。
49.最后,还需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括一个
……”
限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。
50.以上对本技术所提供的技术方案进行了详细介绍,本文中应用了具体个例对本技术的原理及实施方式进行了阐述,以上实施例的说明只是用于帮助理解本技术的方法及其核心思想;同时,对于本领域的一般技术人员,依据本技术的思想,在具体实施方式及应用范围上均会有改变之处,综上所述,本说明书内容不应理解为对本技术的限制。
技术特征:
1.一种司法诉讼风险预测方法,其特征在于,包括:获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。2.根据权利要求1所述的司法诉讼风险预测方法,其特征在于,所述获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注,包括:获取第一历史时间段内的若干企业的数据,并对第二历史时间段内的若干企业的裁判文书进行采集;所述第二历史时间段为所述第一历史时间段之后的一段时间;基于采集到的所述裁判文书对相应的企业进行是否发生司法诉讼的标注。3.根据权利要求1所述的司法诉讼风险预测方法,其特征在于,所述关联关系包括投资股权关系和担保关系。4.根据权利要求1所述的司法诉讼风险预测方法,其特征在于,所述获取若干企业的数据,包括:获取若干企业的基本信息、征信数据和司法数据。5.根据权利要求4所述的司法诉讼风险预测方法,其特征在于,所述获取若干企业的数据之后,还包括:对所述若干企业的数据中的数值型数据进行归一化;和/或,对所述若干企业的数据中的类别型数据进行编码。6.根据权利要求5所述的司法诉讼风险预测方法,其特征在于,所述利用所述关系图谱对初始关系图卷积网络进行训练之前,还包括:对所述关系图谱中不存在征信数据和司法数据的企业进行剔除;和/或,对所述关系图谱中不存在关联关系的企业进行剔除。7.根据权利要求1至6任一项所述的司法诉讼风险预测方法,其特征在于,所述利用所述目标关系图卷积网络对待检测企业进行司法诉讼风险预测,以得到预测概率,包括:通过所述目标关系图卷积网络中的编码器并利用图卷积层对待检测企业的数据进行特征向量提取,以得到所述待检测企业的向量表示;通过所述目标关系图卷积网络中的解码器并利用打分函数对所述待检测企业的向量表示进行司法诉讼风险预测,以得到所述待检测企业的预测概率。8.一种司法诉讼风险预测装置,其特征在于,包括:司法诉讼标注模块,用于获取若干企业的数据,并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;关系图谱构建模块,用于基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;网络训练模块,用于利用所述关系图谱对初始关系图卷积网络进行训练,以得到目标关系图卷积网络;诉讼风险预测模块,用于利用所述目标关系图卷积网络对待检测企业进行司法诉讼风
险预测,以得到预测概率,若所述预测概率大于预设概率阈值,则判定所述待检测企业为高风险企业。9.一种电子设备,其特征在于,包括:存储器,用于保存计算机程序;处理器,用于执行所述计算机程序以实现如权利要求1至7任一项所述的司法诉讼风险预测方法。10.一种计算机可读存储介质,其特征在于,用于保存计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的司法诉讼风险预测方法。
技术总结
本申请公开了一种司法诉讼风险预测方法、装置、设备及存储介质,涉及诉讼风险预测领域,包括:获取若干企业的数据并基于裁判文书对相应的企业进行是否发生司法诉讼的标注;基于若干已标注企业的数据以及对应的标签、若干未标注企业的数据以及各企业之间的关联关系构建关系图谱;利用关系图谱对初始关系图卷积网络进行训练得到目标关系图卷积网络;利用目标关系图卷积网络对待检测企业进行司法诉讼风险预测得到预测概率,若预测概率大于预设阈值则判定待检测企业为高风险企业。本申请通过关系图谱刻画不同企业之间的关联关系,并通过关系图卷积网络对待检测企业的数据以及与其他企业之间的关联关系进行分析,实现对企业司法诉讼风险的有效预测。讼风险的有效预测。讼风险的有效预测。
技术研发人员:徐杨远翔 马超 周平 汤楠
受保护的技术使用者:浙江同信企业征信服务有限公司
技术研发日:2023.08.16
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/
上一篇:一种用于计算机系统的信息安全增强方法 下一篇:一种全息海洋背景场实现方法与流程