一种基于大数据分析的企业信用评估方法及系统与流程

未命名 09-02 阅读:157 评论:0


1.本发明涉及企业信用评估技术领域,具体为一种基于大数据分析的企业信用评估方法及系统。


背景技术:

2.基于大数据分析的企业信用评估系统是一种利用大数据技术和分析方法来评估企业信用状况的系统。它结合了多种数据源和算法,通过对大量的企业数据进行收集、整合和分析,从而评估企业的信用风险和信用能力。
3.现有的企业信用评估系统,大部分是通过财务数据对企业信用进行综合性评估,然而财务数据只能反映企业在财务方面的情况,无法全面评估企业的信用状况。企业的信用涉及更广泛的方面,如品牌声誉、市场地位、竞争优势等,且财务数据通常有一定的滞后性,无法及时反映企业所处的市场环境和经济形势的变化。企业的信用评估需要考虑到宏观经济因素、行业趋势以及信息对企业的影响,而这些信息无法通过财务数据单独获取,进而导致无法准确捕捉到企业的实际信用风险。


技术实现要素:

4.解决的技术问题:针对现有技术的不足,本发明提供了一种基于大数据分析的企业信用评估方法及系统,综合考虑财务数据、信息声誉和影响力,评估模型可以更准确地反映企业的整体信用风险和信用能力。这有助于决策者更全面地了解企业的信用状况,降低评估的偏差和风险,促进提高反应企业所处的市场环境和经济形势的变化。
5.技术方案:为实现以上目的,本发明通过以下技术方案予以实现:一种基于大数据分析的企业信用评估方法,包括以下方法步骤:s1、采集目标企业财务数据,并通过网络爬虫技术或api接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;s2、对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;s3、对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx;所述信息声誉系数yqx通过以下公式进行计算:;
6.其中,jj表示积极性数据的数量;xj表示消极性数据的数量;zx表示中性数据的数量;sl表示综合情感数量,通过将积极性数据和消极性数据相加得到,即sl=jj+xj;hy表示综合主题活跃度,用来反映讨论和关注度的活跃程度;这个值根据具体情况进行定义和计算;表示为修正常数;s4、通过社交网络分析方法,分析信息数据中的关系网络,分析网络中的节点和度
中心的指标,获取企业影响力系数yxx;所述企业影响力系数yxx通过以下公式计算获取:;式中,c表示度中心性指标,取值为节点的度中心性、入度中心性或出度中心性数量的平均值;minc表示度中心性指标的最小值;maxc表示度中心性指标的最大值;表示修正常数,具体按照实际情况进行修正;通过该公式,将度中心性指标归一化到[0,1]的范围内,使得不同节点的度中心性值进行比较,并计算得到企业的影响力系数yxx;s5、预设标准信用评估模型,将目标企业所述信息声誉系数yqx、企业影响力系数yxx和财务数据输入信用评估模型中,获取评估结果。
[0007]
优选的,所述s1中具体包括:(1)收集与目标企业相关的新闻报道,包括财经新闻、行业新闻和公司公告数据;(2)收集目标企业在社交媒体平台上的用户评论、留言和讨论数据;(3)收集目标企业在各类行业论坛、问答平台上的讨论和提问数据;(4)收集用户对目标企业产品或服务的评价评分数据,包括电商平台上的用户评价、酒店评分和餐厅点评数据;(5)收集与目标企业相关的来自消费者投诉平台的投诉记录信息数据;(6)收集目标企业的财务数据,按照周期月、季度和年周期进行采集。
[0008]
优选的,所述s2具体包括:(1)对收集到的信息数据进行预处理,包括去除特殊字符、标点符号和停用词,进行文本清洗处理;(2)构建情感词典,其中包括积极情感词、消极情感词和中性词,获取情感数据集,并依据情感数据集建立情感分析模型;(3)将预处理后的信息数据输入训练好的情感分析模型,对每个文本进行情感分类;根据情感分析模型的输出结果,将文本分类为积极性数据、消极性数据和中性数据。
[0009]
优选的,将积极性数据、消极性数据和中性数据再次细致分类,其具体方式包括:对比设定阈值进行再次细致分类,具体包括设定一个积极情感得分阈值和消极情感得分阈值,将得分高于积极情感阈值的文本划分为积极性数据jj,得分低于消极情感阈值的文本划分为消极性数据xj,得分介于两个阈值之间的文本划分为中性数据zx。
[0010]
优选的,所述s3中提取方式包括:(1)关键词提取,依据积极性数据、消极性数据和中性数据,提取其中情感修饰词、感叹号、问号,以及情感强度的表示词、程度副词,来量化积极性数据jj、消极性数据xj和中性数据zx,获得综合情感数量sl;(2)主题特征提取,依据积极性数据jj、消极性数据xj和中性数据zx,对其文本中提取主题信息,并结合文本的互动行为,如点赞数、评论数和转发数作为特征,获得综合主题活跃度hy;(3)依据积极性数据jj、消极性数据xj和中性数据zx中的综合情感数量sl和综合主题活跃度hy,计算获得信息声誉系数yqx。
[0011]
优选的,所述s4中具体步骤包括:(1)构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,网络中的节点表示用户,边表示用户之间的关系;(2)计算每个节点的度中心性指标,度中心性表示节点与其他节点之间的连接数量,获取度中心性、入度中心性和出度中心性数量;(3)将度中心性、入度中心性和出度中心性数量进行归一化处理,根据度中心性的归一化值,计算企业影响力系数yxx。
[0012]
优选的,所述s5具体包括:(1)建立标准信用评估模型,使用验证集对标准信用评估模型进行评估和验证,计算标准信用评估模型的准确率、精确度、召回率和f1值指标;(2)利用建立好的信用评估模型对目标企业进行信用评估和预测,将目标企业所述信息声誉系数yqx、企业影响力系数yxx和财务数据输入信用评估模型中,获取评估结果,评估结果设置为打分和排名形式的评估结果。
[0013]
一种基于大数据分析的企业信用评估系统,包括信息数据收集模块:通过网络爬虫技术或api接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;财务数据采集模块:采集企业按照月、季度和年周期采集目标企业的财务数据;数据预处理模块:对收集到的信息数据进行清洗、去除噪声和重复内容,处理缺失值和异常值;情感分析模块:对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;特征主题提取模块:对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx;节点分析模块:分析信息数据中的关系网络,分析网络中的节点和度中心的指标,获取企业影响力系数yxx;评估模型模块:将目标企业的所述信息声誉系数yqx、企业影响力系数yxx和财务数据输入预设信用评估模型中,获取评估结果;实时监测和预警模块:实时监测信息数据的变化,及时发现对企业信用产生负面影响的事件和趋势,生成预警信息。
[0014]
有益效果:本发明提供了一种基于大数据分析的企业信用评估方法及系统。具备以下有益效果:(1)该一种基于大数据分析的企业信用评估方法及系统,通过基于大数据收集与目标企业相关的信息数据,对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx:通过文本挖掘和自然语言处理技术,从信息数据中提取与目标企业信用相关的关键词和主题。这些关键词和主题可以反映用户对企业的评价、产品或服务的质量、公众关注的问题等,从而获得一个信息声誉系数yqx;并将信息声誉系数yqx和企业影响力系数yxx作为额外的输入,能够提供更全面的信息来评估企业的信用状况。综合考虑财务数据、信息声誉和影响力,评估模型可以更准确地反映企业的整体信用风险和信用能力。这有助于决策者更
全面地了解企业的信用状况,降低评估的偏差和风险。
[0015]
(2)该一种基于大数据分析的企业信用评估方法及系统,信息声誉系数yqx可以作为一项指标,结合企业信用评估来综合评估企业的声誉。信息声誉系数考虑了信息中的情感数量和主题活跃度,而企业信用评估则考虑了企业的财务状况方面。通过将两个评估指标结合起来,可以更全面地了解和评估企业的声誉情况。
[0016]
(3)该一种基于大数据分析的企业信用评估方法及系统,通过构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,并计算节点的度中心性指标,可以得到企业的影响力系数yxx,通过计算企业的影响力系数yxx,可以量化企业在信息数据中的影响力。企业影响力系数yxx和信用评估提供了关于企业声誉、信用状况和影响力的信息。这些信息可以帮助企业更好地识别和评估潜在的声誉风险和信用风险。在风险管理和决策制定中,结合两者的结果可以提供更准确的信息和更可靠的依据,降低风险并做出明智的决定。
[0017]
(4)该一种基于大数据分析的企业信用评估方法及系统,将信息声誉系数yqx、企业影响力系数yxx和财务数据输入信用评估模型中,可以获得评估结果,通常以打分和排名形式呈现。这些综合评估结果将综合考虑信息声誉、影响力和财务状况等多个因素,提供一个全面的信用评估结果,帮助用户更好地了解企业的信用状况。基于信用评估结果,企业可以更好地进行风险管理和信用控制。评估结果可以帮助企业识别潜在的信用风险和信息声誉风险,及时采取措施进行风险防范和控制。这有助于保护企业的声誉和信用,并确保良好的商业合作关系。
附图说明
[0018]
图1为本发明基于大数据分析的企业信用评估方法步骤示意图;图2为本发明基于大数据分析的企业信用评估系统框图示意图。
具体实施方式
[0019]
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
[0020]
实施例1:基于大数据分析的企业信用评估系统是一种利用大数据技术和分析方法来评估企业信用状况的系统。它结合了多种数据源和算法,通过对大量的企业数据进行收集、整合和分析,从而评估企业的信用风险和信用能力。
[0021]
现有的企业信用评估系统,大部分是通过财务数据对企业信用进行综合性评估,然而财务数据只能反映企业在财务方面的情况,无法全面评估企业的信用状况。企业的信用涉及更广泛的方面,如品牌声誉、市场地位、竞争优势等,且财务数据通常有一定的滞后性,无法及时反映企业所处的市场环境和经济形势的变化。企业的信用评估需要考虑到宏观经济因素、行业趋势以及信息对企业的影响,而这些信息无法通过财务数据单独获取容易,进而导致无法准确捕捉到企业的实际信用风险。
[0022]
请参阅图1,本发明提供一种基于大数据分析的企业信用评估方法,包括以下方法
步骤:s1、通过网络爬虫技术或api接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;所述s1中具体包括:(1)收集与目标企业相关的新闻报道,包括财经新闻、行业新闻和公司公告数据;(2)收集目标企业在社交媒体平台上的用户评论、留言和讨论数据;(3)收集目标企业在各类行业论坛、问答平台上的讨论和提问数据;(4)收集用户对目标企业产品或服务的评价评分数据,包括电商平台上的用户评价、酒店评分和餐厅点评数据;(5)收集与目标企业相关的来自消费者投诉平台的投诉记录信息数据;(6)收集目标企业的财务数据,按照周期月、季度和年周期进行采集;s2、对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;s3、对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx;所述信息声誉系数yqx通过以下公式进行计算:;
[0023]
其中,jj表示积极性数据的数量;xj表示消极性数据的数量;zx表示中性数据的数量;sl表示综合情感数量,通过将积极性数据和消极性数据相加得到,即sl=jj+xj;hy表示综合主题活跃度,用来反映讨论和关注度的活跃程度;这个值根据具体情况进行定义和计算;表示为修正常数。
[0024]
本实施例中:信息声誉系数yqx可以作为一项指标,结合企业信用评估来综合评估企业的声誉。信息声誉系数yqx考虑了信息中的情感数量和主题活跃度,而企业信用评估则考虑了企业的信用历史、财务状况、业务表现等方面。通过将两个评估指标结合起来,可以更全面地了解和评估企业的声誉情况;综合情感数量sl考虑了积极性数据和消极性数据的数量,从而对文本的整体情感进行了综合评估。综合主题活跃度hy则考虑了文本在特定主题中的讨论和关注度。通过综合考虑情感和活跃度,信息声誉系数yqx能够更全面地评估文本在信息中的表现。
[0025]
修正常数的引入:修正常数α可以根据具体情况进行定义和计算,修正常数可以用于平衡情感数量和主题活跃度对信息声誉系数的影响。通过合理选择修正常数的值,可以调整情感数量和主题活跃度在信息声誉系数中的权重,以适应不同情境下的信息分析需求。
[0026]
s4、通过社交网络分析方法,分析信息数据中的关系网络,分析网络中的节点和度中心的指标,获取企业影响力系数yxx;所述企业影响力系数yxx通过以下公式计算获取:;
[0027]
式中,c表示度中心性指标,取值为节点的度中心性、入度中心性或出度中心性数量的平均值;minc表示度中心性指标的最小值;maxc表示度中心性指标的最大值;表示修正常数,具体按照实际情况进行修正;
通过该公式,将度中心性指标归一化到[0,1]的范围内,使得不同节点的度中心性值进行比较,并计算得到企业的影响力系数yxx。
[0028]
s5、预设标准信用评估模型,将目标企业所述信息声誉系数yqx和企业影响力系数yxx输入信用评估模型中,获取评估结果。
[0029]
本实施例中,通过基于大数据收集与目标企业相关的信息数据,将收集到的信息数据分类为积极性数据、消极性数据和中性数据:情感分析技术可以对文本进行情感倾向性的分类,帮助确定信息数据的情感属性。这样可以对信息数据进行归类,了解用户对目标企业的态度和情绪。
[0030]
对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx:通过文本挖掘和自然语言处理技术,从信息数据中提取与目标企业信用相关的关键词和主题。这些关键词和主题可以反映用户对企业的评价、产品或服务的质量、公众关注的问题等,从而获得一个信息声誉系数yqx;并将信息声誉系数yqx和企业影响力系数yxx作为额外的输入,能够提供更全面的信息来评估企业的信用状况。综合考虑财务数据、信息声誉和影响力,评估模型可以更准确地反映企业的整体信用风险和信用能力。这有助于决策者更全面地了解企业的信用状况,降低评估的偏差和风险。
[0031]
实施例2:本实施例是在实施1中进行的解释说明,具体的,所述s2具体包括:(1)对收集到的信息数据进行预处理,包括去除特殊字符、标点符号和停用词,进行文本清洗处理;可以减少噪声对情感分析的干扰,提高情感分类的准确性(2)构建情感词典,其中包括积极情感词、消极情感词和中性词,获取情感数据集,并依据情感数据集建立情感分析模型;构建情感词典涉及大量的情感词收集和整理工作,可以提供对情感的深入理解,并为情感分析模型提供基础和依据;(3)将预处理后的信息数据输入训练好的情感分析模型,对每个文本进行情感分类;根据情感分析模型的输出结果,将文本分类为积极性数据、消极性数据和中性数据。情感分析模型的输出结果可以帮助理解公众对目标企业的情绪和态度。通过将信息数据分类为积极性数据、消极性数据和中性数据,可以更好地把握公众情绪的变化、态度的倾向以及对企业的评价;实施例3:本实施例是在实施2中进行的解释说明,具体的,将积极性数据、消极性数据和中性数据再次细致分类,其具体方式包括:对比设定阈值进行再次细致分类,具体包括设定一个积极情感得分阈值和消极情感得分阈值,将得分高于积极情感阈值的文本划分为积极性数据jj,得分低于消极情感阈值的文本划分为消极性数据xj,得分介于两个阈值之间的文本划分为中性数据zx。
[0032]
通过设定积极情感得分阈值和消极情感得分阈值,可以将情感分数进一步细致地划分为不同的范围,如高积极、中积极、低积极、高消极、中消极、低消极等。这样可以更精准地描述文本的情感倾向,提供更详细的情感分类结果。通过设定阈值,可以将情感得分高于积极情感阈值的文本划分为积极性数据jj,表示信息中表达了积极的情感倾向;将情感得分低于消极情感阈值的文本划分为消极性数据xj,表示信息中表达了消极的情感倾向;将情感得分介于两个阈值之间的文本划分为中性数据zx,表示信息中情感倾向较为中立。这样可以全面了解信息态度,包括积极、消极和中性的情感倾向。
[0033]
通过细致的情感分类,可以为信息分析提供更详细的结果和报告。例如,可以对积极性数据进行分析,了解公众对企业的赞扬、好评和支持;对消极性数据进行分析,了解公众对企业的批评、抱怨和不满;对中性数据进行分析,了解公众对企业的中立观点和中性评价。这样可以为决策者提供更全面、详细的信息分析,帮助他们更好地了解公众对企业的态度和情绪。
[0034]
实施例4:本实施例是在实施3中进行的解释说明,具体的,所述s3中提取方式包括:(1)关键词提取,依据积极性数据、消极性数据和中性数据,提取其中情感修饰词、感叹号、问号,以及情感强度的表示词、程度副词,来量化积极性数据jj、消极性数据xj和中性数据zx,获得综合情感数量sl;统计关键词的数量或使用权重赋予不同的关键词,可以得到综合情感数量(sl)作为信息声誉的量化指标。
[0035]
(2)主题特征提取,依据积极性数据jj、消极性数据xj和中性数据zx,对其文本中提取主题信息,并结合文本的互动行为,如点赞数、评论数和转发数作为特征,获得综合主题活跃度hy;将主题信息和互动行为特征进行融合,可以使用加权平均、特征组合或其他聚合方法。
[0036]
给互动行为特征设置适当的权重,以反映其对综合主题活跃度的影响程度。
[0037]
根据融合后的特征,计算综合主题活跃度hy的值;(3)依据积极性数据、消极性数据和中性数据中的综合情感数量sl和综合主题活跃度hy,计算获得信息声誉系数yqx。
[0038]
信息声誉系数yqx为企业信用评估提供了关于企业声誉和信用状况的信息,可以作为决策制定的重要参考。在制定业务策略、合作伙伴选择、投资决策等方面,结合信息声誉系数和企业信用评估的结果,可以更全面地评估企业的可信度、可靠性和潜在风险,从而做出更明智的决策。
[0039]
实施例5:本实施例是在实施4中进行的解释说明,具体的,所述s4中具体步骤包括:(1)构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,网络中的节点表示用户,边表示用户之间的关系;(2)计算每个节点的度中心性指标,度中心性表示节点与其他节点之间的连接数量,获取度中心性、入度中心性和出度中心性数量;(3)将度中心性、入度中心性和出度中心性数量进行归一化处理,根据度中心性的归一化值,计算企业影响力系数yxx。
[0040]
本实施例中,通过构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,并计算节点的度中心性指标,可以得到企业的影响力系数yxx,通过计算企业的影响力系数yxx,可以量化企业在信息数据中的影响力。企业影响力系数yxx和信用评估提供了关于企业声誉、信用状况和影响力的信息。这些信息可以帮助企业更好地识别和评估潜在的声誉风险和信用风险。在风险管理和决策制定中,结合两者的结果可以提供更准确的信息和更可靠的依据,降低风险并做出明智的决定。
[0041]
实施例6:本实施例是在实施4中进行的解释说明,具体的,所述s5具体包括:(1)建立标准信用评估模型,使用验证集对标准信用评估模型进行评估和验证,计
算标准信用评估模型的准确率、精确度、召回率和f1值指标;(2)利用建立好的信用评估模型对目标企业进行信用评估和预测,将目标企业所述信息声誉系数yqx、企业影响力系数yxx和财务数据输入信用评估模型中,获取评估结果,评估结果设置为打分和排名形式的评估结果。
[0042]
本实施例中:将信息声誉系数yqx、企业影响力系数yxx和财务数据输入信用评估模型中,可以获得评估结果,通常以打分和排名形式呈现。这些综合评估结果将综合考虑信息声誉、影响力和财务状况等多个因素,提供一个全面的信用评估结果,帮助用户更好地了解企业的信用状况。基于信用评估结果,企业可以更好地进行风险管理和信用控制。评估结果可以帮助企业识别潜在的信用风险和信息声誉风险,及时采取措施进行风险防范和控制。这有助于保护企业的声誉和信用,并确保良好的商业合作关系。
[0043]
一种基于大数据分析的企业信用评估系统,包括信息数据收集模块:通过网络爬虫技术或api接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;财务数据采集模块:采集企业按照月、季度和年周期采集目标企业的财务数据;数据预处理模块:对收集到的信息数据进行清洗、去除噪声和重复内容,处理缺失值和异常值;情感分析模块:对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;特征主题提取模块:对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx;节点分析模块:分析信息数据中的关系网络,分析网络中的节点和度中心的指标,获取企业影响力系数yxx;评估模型模块:将目标企业的所述信息声誉系数yqx和企业影响力系数yxx输入预设信用评估模型中,获取评估结果;实时监测和预警模块:实时监测信息数据的变化,及时发现对企业信用产生负面影响的事件和趋势,生成预警信息。
[0044]
这些模块的应用有助于通过信息数据分析和评估企业的信用状况,提供实时监测和预警,从而帮助企业及时应对信用风险,并保护企业的声誉和信用。
[0045]
尽管已经示出和描述了本发明的实施例,对于本领域的普通技术人员而言,可以理解在不脱离本发明的原理和精神的情况下可以对这些实施例进行多种变化、修改、替换和变型,本发明的范围由所附权利要求及其等同物限定。

技术特征:
1.一种基于大数据分析的企业信用评估方法,其特征在于,包括以下方法步骤:s1、采集目标企业财务数据,并通过网络爬虫技术或api接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;s2、对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;s3、对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx;所述信息声誉系数yqx通过以下公式进行计算:;其中,jj表示积极性数据的数量;xj表示消极性数据的数量;zx表示中性数据的数量;sl表示综合情感数量,通过将积极性数据和消极性数据相加得到,即sl=jj+xj;hy表示综合主题活跃度,用来反映讨论和关注度的活跃程度;这个值根据具体情况进行定义和计算; 表示为修正常数;s4、通过社交网络分析方法,分析信息数据中的关系网络,分析网络中的节点和度中心的指标,获取企业影响力系数yxx;所述企业影响力系数yxx通过以下公式计算获取:;式中,c表示度中心性指标,取值为节点的度中心性、入度中心性或出度中心性数量的平均值;minc表示度中心性指标的最小值;maxc表示度中心性指标的最大值;表示修正常数,具体按照实际情况进行修正;通过该公式,将度中心性指标归一化到[0,1]的范围内,使得不同节点的度中心性值进行比较,并计算得到企业的影响力系数yxx;s5、预设标准信用评估模型,将目标企业所述信息声誉系数yqx、企业影响力系数yxx和财务数据输入信用评估模型中,获取评估结果。2.根据权利要求1所述的一种基于大数据分析的企业信用评估方法,其特征在于,所述s1中具体包括:(1)收集与目标企业相关的新闻报道,包括财经新闻、行业新闻和公司公告数据;(2)收集目标企业在社交媒体平台上的用户评论、留言和讨论数据;(3)收集目标企业在各类行业论坛、问答平台上的讨论和提问数据;(4)收集用户对目标企业产品或服务的评价评分数据,包括电商平台上的用户评价、酒店评分和餐厅点评数据;(5)收集与目标企业相关的来自消费者投诉平台的投诉记录信息数据;(6)收集目标企业的财务数据,按照周期月、季度和年周期进行采集。3.根据权利要求1所述的一种基于大数据分析的企业信用评估方法,其特征在于,所述s2具体包括:(1)对收集到的信息数据进行预处理,包括去除特殊字符、标点符号和停用词,进行文本清洗处理;
(2)构建情感词典,其中包括积极情感词、消极情感词和中性词,获取情感数据集,并依据情感数据集建立情感分析模型;(3)将预处理后的信息数据输入训练好的情感分析模型,对每个文本进行情感分类;根据情感分析模型的输出结果,将文本分类为积极性数据、消极性数据和中性数据。4.根据权利要求3所述的一种基于大数据分析的企业信用评估方法,其特征在于,将积极性数据、消极性数据和中性数据再次细致分类,其具体方式包括:对比设定阈值进行再次细致分类,具体包括设定一个积极情感得分阈值和消极情感得分阈值,将得分高于积极情感阈值的文本划分为积极性数据jj,得分低于消极情感阈值的文本划分为消极性数据xj,得分介于两个阈值之间的文本划分为中性数据zx。5.根据权利要求1所述的一种基于大数据分析的企业信用评估方法,其特征在于,所述s3中提取方式包括:(1)关键词提取,依据积极性数据、消极性数据和中性数据,提取其中情感修饰词、感叹号、问号,以及情感强度的表示词、程度副词,来量化积极性数据jj、消极性数据xj和中性数据zx,获得综合情感数量sl;(2)主题特征提取,依据积极性数据jj、消极性数据xj和中性数据zx,对其文本中提取主题信息,并结合文本的互动行为,如点赞数、评论数和转发数作为特征,获得综合主题活跃度hy;(3)依据积极性数据jj、消极性数据xj和中性数据zx中的综合情感数量sl和综合主题活跃度hy,计算获得信息声誉系数yqx。6.根据权利要求1所述的一种基于大数据分析的企业信用评估方法,其特征在于,所述s4中具体步骤包括:(1)构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,网络中的节点表示用户,边表示用户之间的关系;(2)计算每个节点的度中心性指标,度中心性表示节点与其他节点之间的连接数量,获取度中心性、入度中心性和出度中心性数量;(3)将度中心性、入度中心性和出度中心性数量进行归一化处理,根据度中心性的归一化值,计算企业影响力系数yxx。7.根据权利要求1所述的一种基于大数据分析的企业信用评估方法,其特征在于,所述s5具体包括:(1)建立标准信用评估模型,使用验证集对标准信用评估模型进行评估和验证,计算标准信用评估模型的准确率、精确度、召回率和f1值指标;(2)利用建立好的信用评估模型对目标企业进行信用评估和预测,将目标企业所述信息声誉系数yqx、企业影响力系数yxx和财务数据输入信用评估模型中,获取评估结果,评估结果设置为打分和排名形式的评估结果。8.一种基于大数据分析的企业信用评估系统,其特征在于,包括信息数据收集模块:通过网络爬虫技术或api接口手段,基于大数据收集与目标企业相关的信息数据,获得信息数据;财务数据采集模块:采集企业按照月、季度和年周期采集目标企业的财务数据;数据预处理模块:对收集到的信息数据进行清洗、去除噪声和重复内容,处理缺失值和
异常值;情感分析模块:对收集到的信息数据进行情感分析,将收集到的信息数据分类为积极性数据、消极性数据和中性数据;特征主题提取模块:对积极性数据、消极性数据和中性数据进行特征提取,提取特征关键词和若干个主题,识别与目标企业信用相关的特征关键词和主题,获取信息声誉系数yqx;节点分析模块:分析信息数据中的关系网络,分析网络中的节点和度中心的指标,获取企业影响力系数yxx;评估模型模块:将目标企业的所述信息声誉系数yqx、企业影响力系数yxx和财务数据输入预设信用评估模型中,获取评估结果;实时监测和预警模块:实时监测信息数据的变化,及时发现对企业信用产生负面影响的事件和趋势,生成预警信息。

技术总结
本发明公开了一种基于大数据分析的企业信用评估方法及系统,涉及企业信用评估技术领域,该系统采集目标企业的财务数据,并基于大数据采集信息数据,识别分析从而获得信息声誉系数Yqx;通过构建信息数据的用户互动关系网络和目标企业与其他用户之间的关系网络,并计算节点的度中心性指标,可以得到企业的影响力系数Yxx;并将信息声誉系数Yqx和企业影响力系数Yxx作为额外的输入信用评估模型中,能够提供更全面的信息来评估企业的信用状况。综合考虑财务数据、信息声誉和影响力,有助于决策者更全面地了解企业的信用状况,降低评估的偏差和风险,促进提高反应企业所处的市场环境和经济形势的变化。济形势的变化。济形势的变化。


技术研发人员:朱飞
受保护的技术使用者:深圳市爱为物联科技有限公司
技术研发日:2023.07.19
技术公布日:2023/8/31
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐