企业创新能力评估方法及系统与流程

未命名 10-25 阅读:83 评论:0


1.本技术涉及数据分析技术领域,具体涉及一种企业创新能力评估方法及系统。


背景技术:

2.企业创新能力通常指企业自主创新、科技研发、技术引进等方面的实际能力和水平。企业创新能力可以被视为企业的核心竞争力之一,它对企业的长期发展具有决定性的影响。而对企业创新能力的评估对于企业的发展具有重要的意义。它可以帮助企业建立科学的创新管理体系,促进企业技术创新能力的提高,通过评估企业的创新力,可以确定企业在技术创新方面的优势和劣势,有助于企业制定相应的战略,提高自身的竞争优势。评估结果可以帮助企业确定自身的创新能力和发展动力,为企业的可持续发展提供基础保障。
3.然而传统的评估方法主要包括投入产出法、知识交流法、商业中心法、分类测度法等。这些方法均也存在一些缺陷和问题,如评价指标的单一性、评估结果受到主观因素影响、无法综合考虑多个因素的影响等。这些方法难以满足企业创新能力的全面性评估需求。因此,亟需一套系统性、全面性的方法来对企业创新能力进行评估。


技术实现要素:

4.本技术提供了一种企业创新能力评估方法,可以提高对企业创新能力评估的准确性。
5.第一方面,本技术提供了一种企业创新能力评估方法,包括:对获取到的目标企业的企业数据进行预处理,得到创新能力评估指标;将所述创新能力评估指标输入至训练完成的聚类模型,输出各个所述创新能力评估指标的分类概率,所述训练完成的聚类模型由第一聚类模型通过各企业的企业数据训练集和第二创新能力评估指标训练得到,所述第二创新能力评估指标和所述第一聚类模型由初始聚类模型通过第一创新能力评估指标训练得到,所述第一创新能力评估指标由各所述企业的企业数据训练集通过预处理以及聚类处理得到;根据各个所述分类概率,得到所述目标企业的创新能力评分,根据所述创新能力评分对所述目标企业的创新能力进行评估。
6.通过采用上述技术方案,可以将目标企业的创新能力评估指标输入到聚类模型中进行分类,生成各个创新能力评估指标的分类概率,并根据各分类概率计算出目标企业的创新能力评分。聚类模型综合了分类和聚类的优点,可以进行无监督学习和有监督学习的结合,增加了评估体系的完备性和可预测性,可以作为一套系统性、全面性的评估体系对企业的创新能力进行评估。
7.可选的,所述对获取到目标企业的企业数据进行预处理,得到创新能力评估指标之前,还包括:对获取到的各所述企业的企业数据训练集进行预处理,得到创新能力评估指标训练集;
对所述创新能力评估指标训练集进行聚类处理,得到所述第一创新能力评估指标;根据所述第一创新能力评估指标,以及所述数据训练集对初始聚类模型进行训练,得到第一聚类模型以及第二创新能力评估指标;根据所述第二创新能力评估指标对所述第一聚类模型进行训练,得到所述训练完成的聚类模型。
8.通过采用上述技术方案,利用聚类算法,将企业数据按照相似度进行分类,该分类方式能够较为全面地反映不同企业在数据特征上的差异,避免了单一指标评估的缺陷。进一步地,基于第一聚类模型,结合第二创新能力评估指标,对企业进行更精细的划分,提高聚类模型的准确度和可靠性。
9.可选的,所述对获取到的各所述企业的企业数据训练集进行预处理,得到创新能力评估指标训练集,包括:筛除获取到的各所述企业的企业数据训练集中的重复数据,得到筛除后的企业数据训练集;根据创新力评估报告,提取所述筛除后的企业数据训练集中的创新量化指标,得到所述创新能力评估指标训练集。
10.通过采用上述技术方案,筛除重复数据,可以提高数据集的质量和准确性,避免了重复数据的影响。有助于提高数据处理的效率和精度,提高数据分析的准确度。进一步地,通过提取所述筛除后的企业数据训练集中的创新量化指标,得到创新能力评估指标训练集,从而确定创新能力评估的关键指标,提高后续的数据处理效率。
11.可选的,所述对所述创新能力评估指标训练集进行聚类处理,得到所述第一创新能力评估指标,包括:将所述创新能力评估指标训练集中的各创新能力评估指标作为数据点,并划分为k个簇,其中,k为预设的分簇数量;重复执行确定各所述簇中的任意一数据点作为质心,计算各所述质心与各所述数据点的相似度,将相似度大于阈值的数据点归类到对应于质心所在的簇中的步骤,直至各所述质心不变;计算k个所述簇的簇内平方和,将k个所述簇中簇内平方和大于阈值的簇作为第一创新能力评估指标。
12.通过采用上述技术方案,在训练集上将各创新能力评估指标作为数据点并分簇,通过聚类分析有效地区分企业之间的创新能力状况,为企业提供全面可靠的创新能力评估依据;通过多次计算数据点与质点的相似度,通过阈值的调整将数据点归入簇中,构建出一组k个簇,提高了对企业创新能力状况的准确性和可靠性;计算各簇的簇内平方和,从而确定各簇内成员数据点的相似性和差异性,从而针对企业不同的创新能力状态划分不同的簇,为企业制定优化的创新战略提供科学依据。
13.可选的,所述初始聚类模型为分布式梯度提升模型,所述根据所述第一创新能力评估指标,以及所述数据训练集对初始聚类模型进行训练,得到第一聚类模型以及第二创新能力评估指标,包括:根据所述第一创新能力评估指标对所述数据训练集进行分类标注;
根据分类标注后的数据训练集迭代训练所述分布式梯度提升模型,直至所述分布式梯度提升模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到第一聚类模型;将所述第一聚类模型中特征重要性值大于第一阈值,且贡献值大于第二阈值的第一创新能力评估指标,作为所述第二创新能力评估指标并输出。
14.通过采用上述技术方案,根据第一创新能力评估指标对数据训练集进行分类标注,可以更好地挖掘企业内不同的创新能力,有利于开展更加精准的创新能力评估;通过分布式梯度提升模型的迭代训练,可以不断调整模型参数,最终得到最优的分类模型,提高了对企业创新能力的准确预测和分析;通过特征重要性值大于第一阈值并且贡献值大于第二阈值的创新能力评估指标的筛选和输出,能够更好的了解企业中不同创新能力的特征和贡献度,为企业精准制定创新战略提供科学依据。
15.可选的,所述根据所述第二创新能力评估指标对所述第一聚类模型进行训练,得到所述训练完成的聚类模型,包括:根据所述第二创新能力评估指标对所述数据训练集进行分类标注;根据分类标注后的数据训练集迭代训练所述第一聚类模型,直至所述第一聚类模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到所述训练完成的聚类模型。
16.通过采用上述技术方案,结合第一创新能力评估指标和第二创新能力评估指标,综合评估企业的创新能力和特征,以更好地指导企业制定创新发展战略。
17.可选的,所述根据各个所述分类概率,得到所述目标企业的创新能力评分,包括:将各个所述分类概率与预设分数进行加权求和,得到所述目标企业的创新能力评分。
18.通过采用上述技术方案,通过将各个分类概率与预设分数进行加权求和,可以综合评估企业的创新能力和特征,更加客观全面地了解其创新潜力和竞争力。
19.在本技术的第二方面提供了一种企业创新能力评估系统,所述系统包括:评估指标确定模块,用于对获取到的目标企业的企业数据进行预处理,得到创新能力评估指标;分类概率计算模块,用于将所述创新能力评估指标输入至训练完成的聚类模型,输出各个所述创新能力评估指标的分类概率,所述训练完成的聚类模型由第一聚类模型通过各企业的企业数据训练集和第二创新能力评估指标训练得到,所述第二创新能力评估指标和所述第一聚类模型由初始聚类模型通过第一创新能力评估指标训练得到,所述第一创新能力评估指标由各所述企业的企业数据训练集通过预处理以及聚类处理得到;创新能力评估模块,用于根据各个所述分类概率,得到所述目标企业的创新能力评分,根据所述创新能力评分对所述目标企业的创新能力进行评估。
20.在本技术的第三方面提供了一种计算机存储介质,所述计算机存储介质存储有多条指令,所述指令适于由处理器加载并执行上述的方法步骤。
21.在本技术的第四方面提供了一种电子设备,包括:处理器、存储器;其中,所述存储器存储有计算机程序,所述计算机程序适于由所述处理器加载并执行上述的方法步骤。
22.综上所述,本技术实施例中提供的一个或多个技术方案,至少具有如下技术效果
或优点:通过采用本技术技术方案,可以将目标企业的创新能力评估指标输入到聚类模型中进行分类,生成各个创新能力评估指标的分类概率,并根据各分类概率计算出目标企业的创新能力评分。聚类模型综合了分类和聚类的优点,可以进行无监督学习和有监督学习的结合,增加了评估体系的完备性和可预测性,可以作为一套系统性、全面性的评估体系对企业的创新能力进行评估。
附图说明
23.图1是本技术实施例提供的一种企业创新能力评估方法的流程示意图;图2是本技术实施例提供的另一种企业创新能力评估方法的流程示意图;图3是本技术实施例提供的一种企业创新能力评估系统的结构示意图。
24.图4是本技术实施例的公开的一种电子设备的结构示意图。
25.附图标记说明:701、评估指标确定模块;702、分类概率计算模块;703、创新能力评估模块;800、电子设备;801、处理器;802、存储器;803、用户接口;804、网络接口;805、通信总线。
具体实施方式
26.为了使本领域的技术人员更好地理解本说明书中的技术方案,下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本技术一部分实施例,而不是全部的实施例。
27.在本技术实施例的描述中,“例如”或者“举例来说”等词用于表示作例子、例证或说明。本技术实施例中被描述为“例如”或者“举例来说”的任何实施例或设计方案不应被解释为比其他实施例或设计方案更优选或更具优势。确切而言,使用“例如”或者“举例来说”等词旨在以具体方式呈现相关概念。
28.在本技术实施例的描述中,术语“多个”的含义是指两个或两个以上。例如,多个系统是指两个或两个以上的系统,多个屏幕终端是指两个或两个以上的屏幕终端。此外,术语“第一”、“第二”仅用于描述目的,而不能理解为指示或暗示相对重要性或者隐含指明所指示的技术特征。由此,限定有“第一”、“第二”的特征可以明示或者隐含地包括一个或者更多个该特征。术语“包括”、“包含”、“具有”及它们的变形都意味着“包括但不限于”,除非是以其他方式另外特别强调。
29.本技术实施例提供了一种企业创新能力评估方法,该方法主要通过分类模型对企业的创新能力进行评估,下面先对该分类模型的训练过程进行说明,请参照图1,其示出了本技术实施例提供的一种企业创新能力评估方法的流程示意图,该方法可依赖于计算机程序实现,也可运行于基于冯诺依曼体系的企业创新能力评估系统上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行,该过程主要包括步骤101至步骤104,如下:步骤101:对获取到的各企业的企业数据训练集进行预处理,得到创新能力评估指标训练集。
30.其中,各企业指的是国家高新技术企业、专精特新企业、制造业冠军企业、小巨人企业等各种类型的创新型企业。企业数据训练集在本技术实施例中可以理解为从各企业中
获取数据而组成的集合。
31.创新能力评估指标的选取主要参考中国创新力评估报告,从创新投入能力、协同创新能力、知识产权能力、驱动创先能力方面选择尽量多的可计算量化指标。
32.进一步地,为了提高分类模型预测企业创新能力的全面性,训练用的企业样本数据应该尽量覆盖全面,在获取到各企业的企业数据训练集后,可根据国内的创新能力量化指标,提取企业数据训练集中的相关数据,得到创新能力评估指标训练集。
33.在上述实施例的基础上,作为一种可选的实施例,步骤101:对获取到的各企业的企业数据训练集进行预处理,得到创新能力评估指标训练集这一步骤,具体还可以包括以下步骤:步骤201:筛除获取到的各企业的企业数据训练集中的重复数据,得到筛除后的企业数据训练集。
34.步骤202:根据创新力评估报告,提取筛除后的企业数据训练集中的创新量化指标,得到创新能力评估指标训练集。
35.具体的,首先需要对获取到的各企业的企业数据训练集进行清洗和预处理,去除重复或者无效的数据,得到筛除后的企业数据训练集。接着,根据创新力评估报告,提取出与企业技术创新能力相关的创新量化指标。
36.在一种可行的实施方式中,创新量化指标可以包括研究和开发(research and development,r&d)人员情况、r&d经费情况、r&d项目情况、企业办研发机构情况、新产品开发与生产情况、自主知识产权情况、政府相关政策落实情况以及技术获取以及技术改造情况等指标。这些指标需要能够较准确地衡量企业的技术创新能力,同时具有可度量性和可比性,以便在后续的评价模型中进行分析比较。
37.进一步地,需要对提取出的创新量化指标进行标准化处理,以便后续的模型训练。在标准化的过程中,可以采用z-score标准化方法进行标准化。通过数据清洗、指标提取和标准化处理,可以得到创新能力评估指标训练集,为后续的分类模型训练和评价打下基础。
38.步骤102:对创新能力评估指标训练集进行聚类处理,得到第一创新能力评估指标。
39.其中,聚类处理是一种无监督学习方法,其主要目的是将样本数据划分成若干个类簇,使得每个类簇内的数据点彼此相似度较高,不同类簇之间数据点的相似度较低。目标是使得同一类簇内的数据点彼此更加相似,而不同类簇间的数据点尽量不同,以此实现对数据集的潜在结构的探索和发现。
40.具体的,对于企业的创新评估,可以将创新能力评估指标训练集输入聚类算法进行处理。聚类处理可以将相似的指标分为一类,并提取出代表性最强的指标,组成第一创新能力评估指标。
41.具体的,作为一种可选的实施例,聚类处理可以采用k-means聚类方法,步骤102:对创新能力评估指标训练集进行聚类处理,得到第一创新能力评估指标这一步骤,具体还可以包括以下步骤:步骤301:将创新能力评估指标训练集中的各创新能力评估指标作为数据点,并划分为k个簇,其中,k为预设的分簇数量。
42.具体的,可将每个创新能力评估指标评估指标看成数据空间中的一个数据点,通
过k-means聚类方法可将相似度高的数据点聚类成一个簇。其中,簇的数量k可以是预先设定的,代表期望分簇的数量。选择k个样本点作为初始聚类中心,一般可以随机选取k个样本点作为初始的聚类中心。然后通过设置预设值k来划分数据点为k个簇。这样可以使评估指标在空间上更清晰地呈现出来。
43.步骤302:重复执行确定各簇中的任意一数据点作为质心,计算各质心与各数据点的相似度,将相似度大于阈值的数据点归类到对应于质心所在的簇中的步骤,直至各质心不变。
44.具体的,先从创新能力评估指标训练集中任意选择一个数据点作为簇的质心;其次计算该质心与所有数据点之间的距离(通常采用欧氏距离或曼哈顿距离等),将所有数据点归类到距离质心最近的簇中;最后计算新的质心坐标,即将同一个簇内所有数据点的坐标取平均值得到的新坐标,重复上述过程,直到簇内的数据点不再改变,即质心不再发生变化,最后便得到了分簇的结果。这一步的目的是通过计算数据点之间的相似度,将相似度大于阈值的数据点归类到对应的簇中。
45.步骤303:计算k个簇的簇内平方和,将k个簇中簇内平方和大于阈值的簇作为第一创新能力评估指标。
46.具体的,计算k个簇内各个数据点到其质心的距离和的平方和,即簇内平方和(sse)。可以通过计算sse值来评估聚类效果。sse值越小,表示聚类效果越好。当某个簇的sse值大于设定的阈值时,确定该簇可以满足创新能力评估指标的要求,并该簇内的数据点定义为第一创新能力评估指标。
47.步骤103:根据第一创新能力评估指标,以及数据训练集对初始聚类模型进行训练,得到第一聚类模型以及第二创新能力评估指标。
48.具体的,根据第一创新能力评估指标,对创新能力评估指标的训练集进行分类标注。使用分类标注后的数据训练分布式梯度提升模型,最终得到第一聚类模型。此时,通过对第一聚类模型中的特征重要性值进行分析,可筛选得到第二创新能力评估指标。
49.具体的,作为一种可选的实施例,步骤103:根据第一创新能力评估指标,以及数据训练集对初始聚类模型进行训练,得到第一聚类模型以及第二创新能力评估指标这一步骤,具体还可以包括以下步骤:步骤401:根据第一创新能力评估指标对数据训练集进行分类标注。
50.具体的,可根据第一创新能力评估指标对创新能力评估指标训练集进行分类标注,即将训练集中的每个数据点分到不同的类别中。以为后续的模型训练提供有标注的数据集。
51.步骤402:根据分类标注后的数据训练集迭代训练分布式梯度提升模型,直至分布式梯度提升模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到第一聚类模型。
52.示例性地,先将数据集划分为训练集和测试集,从训练集中使用分布式梯度提升算法来训练决策树模型。分布式梯度提升算法的核心是逐步训练弱分类器,并将所有分类器组合成一个强分类器。在每一次迭代中,算法会根据当前分类误差来调整训练数据集的权重,然后训练下一个决策树分类器。通过反复迭代,不断加强弱分类器的性能,并将它们组合成一个强分类器,直到分类精度达到预设的要求或达到最大迭代次数为止。最终便可
得到第一聚类模型,它可以将新的数据点划分到不同的类别中,从而实现预测和分类的目的。
53.具体的,可根据分类标注后的数据训练集,使用分布式梯度提升算法进行模型训练。该算法是一种通过递归地训练决策树来减少预测误差的机器学习算法,能够有效地处理高维稀疏数据,并且在处理大规模数据时具有很好的性能。在训练模型时,通过调整算法的超参数,直至达到最优解,或者迭代训练次数达到预设最大次数时停止迭代,得到第一聚类模型。
54.步骤403:将第一聚类模型中特征重要性值大于第一阈值,且贡献值大于第二阈值的第一创新能力评估指标,作为第二创新能力评估指标并输出。
55.具体的,分析第一聚类模型中的特征重要性值,并选出其中具有重要性的创新能力评估指标,作为第二创新能力评估指标。通常情况下,我们设置两个阈值来确定第二创新能力评估指标。第一阈值用于筛选出特征重要性值大于该阈值的特征,第二阈值用于筛选出在第一阈值范围内的创新能力评估指标中贡献值大于该阈值的指标。从而更加准确地确定第二创新能力评估指标。
56.在一种可行的实施方式中,可设置特征重要性值(shap_value)大于0,且贡献值(feature_value)大于0.02的创新能力评估指标,确定为第二创新能力评估指标。最终得到的第二创新能力评估指标可以是r&d人员总数、参加项目人员数、项目人员折合全时当量、r&d人员折合全时当量、项目数企业资金投入、新产品开发项目数、研究人员数、全时人员数、项目经费内部支出、专利申请数、新产品开发经费支出、日常性支出人员劳务费以及r&d经费内部支出等。
57.步骤104:根据第二创新能力评估指标对第一聚类模型进行训练,得到训练完成的聚类模型。
58.其中,对于创新能力评估指标,通常会选择多个指标进行评价。因为对企业创新能力的评估,通常涉及到多方面的因素,单一指标往往不能够全面准确地反映出企业的创新能力。
59.在上述实施例中,第一创新能力评估指标用于初步划分训练集,确定训练数据的大致分类;而第二创新能力评估指标则能根据创新活动的更多细节信息,进一步对训练集进行细致的分类标注。这样,我们可以将更多的因素纳入到模型训练当中,使得模型的准确性和稳定性得到进一步提升。
60.具体的,作为一种可选的实施例,步骤104:根据第二创新能力评估指标对第一聚类模型进行训练,得到训练完成的聚类模型这一步骤,具体还可以包括以下步骤:步骤501:根据第二创新能力评估指标对数据训练集进行分类标注。
61.步骤502:根据分类标注后的数据训练集迭代训练第一聚类模型,直至第一聚类模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到训练完成的聚类模型。
62.具体的,步骤501至步骤502的具体过程可参照步骤401至步骤403中的描述,在此不做过多赘述。
63.上述实施例对聚类模型的训练过程进行了详细的说明,在上述实施例的基础上,请参照图2,图2为本技术实施例提供的一种企业创新能力评估方法的流程示意图,该方法
可依赖于计算机程序实现,可依赖于单片机实现,也可运行于基于冯诺依曼体系的企业创新能力评估系统上。该计算机程序可集成在应用中,也可作为独立的工具类应用运行。具体的,该方法可以包括以下步骤:步骤601:对获取到的目标企业的企业数据进行预处理,得到创新能力评估指标。
64.具体的,对企业数据进行预处理的过程在上述步骤101中已经做了详尽说明,步骤601的具体过程可参照步骤101中的描述,在此不做过多赘述。
65.步骤602:将创新能力评估指标输入至训练完成的聚类模型,输出各个创新能力评估指标的分类概率,训练完成的聚类模型由第一聚类模型通过各企业的企业数据训练集和第二创新能力评估指标训练得到,第二创新能力评估指标和第一聚类模型由初始聚类模型通过第一创新能力评估指标训练得到,第一创新能力评估指标由各企业的企业数据训练集通过预处理以及聚类处理得到。
66.具体的,在聚类模型训练阶段,已经将各企业的企业数据训练集通过预处理以及聚类处理得到了第一聚类模型,该模型通过第一创新能力评估指标进行训练,得到各个聚类中心及其对应的标签。在此基础上,再根据第二创新能力评估指标,对数据进行更为细致的分类标注,得到创新能力评估指标的标注数据。将标注数据与原有的企业数据训练集一起,再次使用k-means法进行聚类,得到训练完成的聚类模型。
67.该训练完成的聚类模型不仅包含第一聚类模型中所做的分类,还包含了第二创新能力评估指标的分类结果。通过训练完成的聚类模型,可以根据输入的企业数据,输出各个创新能力评估指标所属的分类概率。
68.步骤603:根据各个分类概率,得到目标企业的创新能力评分,根据创新能力评分对目标企业的创新能力进行评估。
69.具体的,对于每一个创新能力评估指标,将其输入到训练完成的聚类模型中,得到该指标属于各个分类的概率值。然后根据各个指标所属分类的概率值,计算出该企业在每个分类中所占的比例,并根据分类的权重和该企业在各分类中的比例,得到该企业的创新能力评分。
70.在一种可行的实施方式中,可根据目标企业近几年的创新能力评分预测。在对公司近五年的创新能力进行评估之后,可以通过时间序列分析,预测其未来的创新力趋势。在时间序列分析中,可以使用时间序列模型来探究数据的发展趋势以及可能变化的情境。根据不同的趋势,一般可以将时间序列分为三类:持续提升:如果时间序列呈现逐年上升的趋势,那么可认为目标企业在未来可能会持续提升其创新能力。这可能是由于目标企业在相应领域内存在技术优势和创新能力的提升,也可能是由于市场的需求不断增加,推动了目标企业不断加强创新能力的发展。可以根据这一趋势,为目标企业提供相应的建议,例如鼓励其继续加强研发投入,提高技术水平等。
71.逐步下降:如果时间序列呈现逐年减少的趋势,那么可认为目标企业未来的创新能力可能面临着逐步下降的压力。这可能是由于目标企业内部的创新氛围逐渐消失,或者是市场环境发生了重大变化,导致该目标企业的创新能力在长期内难以保持优势。对于这种趋势,可以建议该目标企业及时调整战略,在关键领域加强技术研究和市场开发,以避免进一步的下滑。
72.动态波动:如果时间序列在均值附近波动,那么可认为该目标企业的创新能力将呈现动态波动的趋势。这种趋势可能是由于该目标企业内部在不同领域的创新能力表现出现了波动,或者是市场环境在不同时间点对于该目标企业的影响不同而导致的。对于这种趋势,需要考虑具体的原因,并结合目标企业内外部环境作出相应的调整,在保持创新能力的基础上,最大程度地减少动态波动的影响。
73.通过对目标企业的创新能力评分预测,不仅可以了解目标企业当前的创新能力状态,还可以根据时间序列的趋势,预测未来的创新力发展趋势,并提供相应的建议和决策。
74.本技术实施例提出了一种企业创新能力评估方法,该方法基于机器学习的方式,系统化地构建了企业创新能力评估指标体系,具有科学性与合理性,方法有效,在不同维度的创新力特征上有显著的分类差异,将无监督学习和监督学习的方式结合,发挥了聚类模型和分类模型的各自优势,具有完备性和可预测性,可以作为一套系统的评估指标体系构建方法的范式进行推广和应用。
75.参照图3,本技术还提供了一种企业创新能力评估系统,包括:评估指标确定模块、分类概率计算模块以及创新能力评估模块,其中:上述评估指标确定模块701,用于对获取到的目标企业的企业数据进行预处理,得到创新能力评估指标;上述分类概率计算模块702,用于将上述创新能力评估指标输入至训练完成的聚类模型,输出各个上述创新能力评估指标的分类概率,上述训练完成的聚类模型由第一聚类模型通过各企业的企业数据训练集和第二创新能力评估指标训练得到,上述第二创新能力评估指标和上述第一聚类模型由初始聚类模型通过第一创新能力评估指标训练得到,上述第一创新能力评估指标由各上述企业的企业数据训练集通过预处理以及聚类处理得到;上述创新能力评估模块703,用于根据各个上述分类概率,得到上述目标企业的创新能力评分,根据上述创新能力评分对上述目标企业的创新能力进行评估。
76.在上述实施例的基础上,作为一种可选的实施例,上述企业创新能力评估系统还包括:创新能力评估指标训练集确定模块、第一创新能力评估指标确定模块、第二创新能力评估指标确定模块以及聚类模型训练模块,其中:上述创新能力评估指标训练集确定模块,用于对获取到的各上述企业的企业数据训练集进行预处理,得到创新能力评估指标训练集;上述第一创新能力评估指标确定模块,用于对上述创新能力评估指标训练集进行聚类处理,得到上述第一创新能力评估指标;上述第二创新能力评估指标确定模块,用于根据上述第一创新能力评估指标,以及上述数据训练集对初始聚类模型进行训练,得到第一聚类模型以及第二创新能力评估指标;上述聚类模型训练模块,用于根据上述第二创新能力评估指标对上述第一聚类模型进行训练,得到上述训练完成的聚类模型。
77.在上述实施例的基础上,作为一种可选的实施例,上述创新能力评估指标训练集确定模块还可以包括:企业数据训练集确定单元以及创新能力评估指标训练集确定单元,其中:上述企业数据训练集确定单元,用于筛除获取到的各上述企业的企业数据训练集
中的重复数据,得到筛除后的企业数据训练集;上述创新能力评估指标训练集确定单元,用于根据创新力评估报告,提取上述筛除后的企业数据训练集中的创新量化指标,得到上述创新能力评估指标训练集。
78.在上述实施例的基础上,作为一种可选的实施例,上述第一创新能力评估指标确定模块还可以包括:第一分簇单元、第二分簇单元以及第一创新能力评估指标确定单元,其中:上述第一分簇单元,用于将上述创新能力评估指标训练集中的各创新能力评估指标作为数据点,并划分为k个簇,其中,k为预设的分簇数量;上述第二分簇单元,用于重复执行确定各上述簇中的任意一数据点作为质心,计算各上述质心与各上述数据点的相似度,将相似度大于阈值的数据点归类到对应于质心所在的簇中的步骤,直至各上述质心不变;上述第一创新能力评估指标确定单元,用于计算k个上述簇的簇内平方和,将k个上述簇中簇内平方和大于阈值的簇作为第一创新能力评估指标。
79.在上述实施例的基础上,作为一种可选的实施例,上述第二创新能力评估指标确定模块还可以包括:分类标注单元、第一聚类模型确定单元以及第二创新能力评估指标确定单元,其中:上述第一分类标注单元,用于根据上述第一创新能力评估指标对上述数据训练集进行分类标注;上述第一聚类模型确定单元,用于根据分类标注后的数据训练集迭代训练上述分布式梯度提升模型,直至上述分布式梯度提升模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到第一聚类模型;上述第二创新能力评估指标确定单元,用于将上述第一聚类模型中特征重要性值大于第一阈值,且贡献值大于第二阈值的第一创新能力评估指标,作为上述第二创新能力评估指标并输出。
80.在上述实施例的基础上,作为一种可选的实施例,上述聚类模型训练模块还可以包括:第二分类标注单元以及聚类模型训练单元,其中:第二分类标注单元,用于根据上述第二创新能力评估指标对上述数据训练集进行分类标注;聚类模型训练单元,用于根据分类标注后的数据训练集迭代训练上述第一聚类模型,直至上述第一聚类模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到上述训练完成的聚类模型。
81.在上述实施例的基础上,作为一种可选的实施例,上述创新能力评估模块703还可以包括:创新能力评估单元,其中:上述创新能力评估单元,用于将各个上述分类概率与预设分数进行加权求和,得到上述目标企业的创新能力评分。
82.需要说明的是:上述实施例提供的装置在实现其功能时,仅以上述各功能模块的划分进行举例说明,实际应用中,可以根据需要而将上述功能分配由不同的功能模块完成,即将设备的内部结构划分成不同的功能模块,以完成以上描述的全部或者部分功能。另外,上述实施例提供的装置和方法实施例属于同一构思,其具体实现过程详见方法实施例,这
里不再赘述。
83.本技术还公开一种电子设备。参照图4,图4是本技术实施例的公开的一种电子设备的结构示意图。该电子设备800可以包括:至少一个处理器801,至少一个网络接口804,用户接口803,存储器802,至少一个通信总线805。
84.其中,通信总线805用于实现这些组件之间的连接通信。
85.其中,用户接口803可以包括显示屏(display)、摄像头(camera),可选用户接口803还可以包括标准的有线接口、无线接口。
86.其中,网络接口804可选的可以包括标准的有线接口、无线接口(如wi-fi接口)。
87.其中,处理器801可以包括一个或者多个处理核心。处理器801利用各种接口和线路连接整个服务器内的各个部分,通过运行或执行存储在存储器802内的指令、程序、代码集或指令集,以及调用存储在存储器802内的数据,执行服务器的各种功能和处理数据。可选的,处理器801可以采用数字信号处理(digital signal processing,dsp)、现场可编程门阵列(field-programmable gate array,fpga)、可编程逻辑阵列(programmable logic array,pla)中的至少一种硬件形式来实现。处理器801可集成中央处理器(central processing unit,cpu)、图像处理器(graphics processing unit,gpu)和调制解调器等中的一种或几种的组合。其中,cpu主要处理操作系统、用户界面图和应用程序等;gpu用于负责显示屏所需要显示的内容的渲染和绘制;调制解调器用于处理无线通信。可以理解的是,上述调制解调器也可以不集成到处理器801中,单独通过一块芯片进行实现。
88.其中,存储器802可以包括随机存储器(random access memory,ram),也可以包括只读存储器(read-only memory)。可选的,该存储器802包括非瞬时性计算机可读介质(non-transitory computer-readable storage medium)。存储器802可用于存储指令、程序、代码、代码集或指令集。存储器802可包括存储程序区和存储数据区,其中,存储程序区可存储用于实现操作系统的指令、用于至少一个功能的指令(比如触控功能、声音播放功能、图像播放功能等)、用于实现上述各个方法实施例的指令等;存储数据区可存储上面各个方法实施例中涉及的数据等。存储器802可选的还可以是至少一个位于远离前述处理器801的存储装置。参照图4,作为一种计算机存储介质的存储器802中可以包括操作系统、网络通信模块、用户接口模块以及一种企业创新能力评估方法的应用程序。
89.在图4所示的电子设备800中,用户接口803主要用于为用户提供输入的接口,获取用户输入的数据;而处理器801可以用于调用存储器802中存储一种企业创新能力评估方法的应用程序,当由一个或多个处理器801执行时,使得电子设备800执行如上述实施例中一个或多个所述的方法。需要说明的是,对于前述的各方法实施例,为了简单描述,故将其都表述为一系列的动作组合,但是本领域技术人员应该知悉,本技术并不受所描述的动作顺序的限制,因为依据本技术,某些步骤可以采用其他顺序或者同时进行。其次,本领域技术人员也应该知悉,说明书中所描述的实施例均属于优选实施例,所涉及的动作和模块并不一定是本技术所必需的。
90.在上述实施例中,对各个实施例的描述都各有侧重,某个实施例中没有详述的部分,可以参见其他实施例的相关描述。
91.在本技术所提供的几种实施方式中,应该理解到,所披露的装置,可通过其他的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如单元的划分,仅仅为一种逻
辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些服务接口,装置或单元的间接耦合或通信连接,可以是电性或其他的形式。
92.作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
93.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
94.集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储器中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储器中,包括若干指令用以使得一台计算机设备(可为个人计算机、服务器或者网络设备等)执行本技术各个实施例方法的全部或部分步骤。而前述的存储器包括:u盘、移动硬盘、磁碟或者光盘等各种可以存储程序代码的介质。
95.以上所述者,仅为本公开的示例性实施例,不能以此限定本公开的范围。即但凡依本公开教导所作的等效变化与修饰,皆仍属本公开涵盖的范围内。本领域技术人员在考虑说明书及实践真理的公开后,将容易想到本公开的其他实施方案。
96.本技术旨在涵盖本公开的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本公开的一般性原理并包括本公开未记载的本技术领域中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本公开的范围和精神由权利要求限定。

技术特征:
1.一种企业创新能力评估方法,其特征在于,包括:对获取到的目标企业的企业数据进行预处理,得到创新能力评估指标;将所述创新能力评估指标输入至训练完成的聚类模型,输出各个所述创新能力评估指标的分类概率,所述训练完成的聚类模型由第一聚类模型通过各企业的企业数据训练集和第二创新能力评估指标训练得到,所述第二创新能力评估指标和所述第一聚类模型由初始聚类模型通过第一创新能力评估指标训练得到,所述第一创新能力评估指标由各所述企业的企业数据训练集通过预处理以及聚类处理得到;根据各个所述分类概率,得到所述目标企业的创新能力评分,根据所述创新能力评分对所述目标企业的创新能力进行评估。2.根据权利要求1所述的企业创新能力评估方法,其特征在于,所述对获取到目标企业的企业数据进行预处理,得到创新能力评估指标之前,还包括:对获取到的各所述企业的企业数据训练集进行预处理,得到创新能力评估指标训练集;对所述创新能力评估指标训练集进行聚类处理,得到所述第一创新能力评估指标;根据所述第一创新能力评估指标,以及所述数据训练集对初始聚类模型进行训练,得到第一聚类模型以及第二创新能力评估指标;根据所述第二创新能力评估指标对所述第一聚类模型进行训练,得到所述训练完成的聚类模型。3.根据权利要求2所述的企业创新能力评估方法,其特征在于,所述对获取到的各所述企业的企业数据训练集进行预处理,得到创新能力评估指标训练集,包括:筛除获取到的各所述企业的企业数据训练集中的重复数据,得到筛除后的企业数据训练集;根据创新力评估报告,提取所述筛除后的企业数据训练集中的创新量化指标,得到所述创新能力评估指标训练集。4.根据权利要求2所述的企业创新能力评估方法,其特征在于,所述对所述创新能力评估指标训练集进行聚类处理,得到所述第一创新能力评估指标,包括:将所述创新能力评估指标训练集中的各创新能力评估指标作为数据点,并划分为k个簇,其中,k为预设的分簇数量;重复执行确定各所述簇中的任意一数据点作为质心,计算各所述质心与各所述数据点的相似度,将相似度大于阈值的数据点归类到对应于质心所在的簇中的步骤,直至各所述质心不变;计算k个所述簇的簇内平方和,将k个所述簇中簇内平方和大于阈值的簇作为第一创新能力评估指标。5.根据权利要求2所述的企业创新能力评估方法,其特征在于,所述初始聚类模型为分布式梯度提升模型,所述根据所述第一创新能力评估指标,以及所述数据训练集对初始聚类模型进行训练,得到第一聚类模型以及第二创新能力评估指标,包括:根据所述第一创新能力评估指标对所述数据训练集进行分类标注;根据分类标注后的数据训练集迭代训练所述分布式梯度提升模型,直至所述分布式梯度提升模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到第
一聚类模型;将所述第一聚类模型中特征重要性值大于第一阈值,且贡献值大于第二阈值的第一创新能力评估指标,作为所述第二创新能力评估指标并输出。6.根据权利要求2所述的企业创新能力评估方法,其特征在于,所述根据所述第二创新能力评估指标对所述第一聚类模型进行训练,得到所述训练完成的聚类模型,包括:根据所述第二创新能力评估指标对所述数据训练集进行分类标注;根据分类标注后的数据训练集迭代训练所述第一聚类模型,直至所述第一聚类模型的超参数达到最优解,或迭代训练次数达到预设最大次数时停止迭代,得到所述训练完成的聚类模型。7.根据权利要求1所述的企业创新能力评估方法,其特征在于,所述根据各个所述分类概率,得到所述目标企业的创新能力评分,包括:将各个所述分类概率与预设分数进行加权求和,得到所述目标企业的创新能力评分。8.一种企业创新能力评估系统,其特征在于,所述系统包括:评估指标确定模块,用于对获取到的目标企业的企业数据进行预处理,得到创新能力评估指标;分类概率计算模块,用于将所述创新能力评估指标输入至训练完成的聚类模型,输出各个所述创新能力评估指标的分类概率,所述训练完成的聚类模型由第一聚类模型通过各企业的企业数据训练集和第二创新能力评估指标训练得到,所述第二创新能力评估指标和所述第一聚类模型由初始聚类模型通过第一创新能力评估指标训练得到,所述第一创新能力评估指标由各所述企业的企业数据训练集通过预处理以及聚类处理得到;创新能力评估模块,用于根据各个所述分类概率,得到所述目标企业的创新能力评分,根据所述创新能力评分对所述目标企业的创新能力进行评估。9.一种电子设备,其特征在于,包括处理器、存储器、用户接口及网络接口,所述存储器用于存储指令,所述用户接口和网络接口用于给其他设备通信,所述处理器用于执行所述存储器中存储的指令,以使所述电子设备执行如权利要求1-7任意一项所述的方法。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有指令,当所述指令被执行时,执行如权利要求1-7任意一项所述的方法。

技术总结
本申请实施例公开了一种企业创新能力评估方法及系统,其中,方法包括:对获取到的目标企业的企业数据进行预处理,得到创新能力评估指标;将创新能力评估指标输入至训练完成的聚类模型,输出各个创新能力评估指标的分类概率,训练完成的聚类模型由第一聚类模型通过各企业的企业数据训练集和第二创新能力评估指标训练得到,第二创新能力评估指标和第一聚类模型由初始聚类模型通过第一创新能力评估指标训练得到,第一创新能力评估指标由各企业的企业数据训练集通过预处理以及聚类处理得到;根据各个分类概率,得到目标企业的创新能力评分,根据创新能力评分对目标企业的创新能力进行评估。采用本申请实施例,可以提高对企业创新能力评估的准确性。新能力评估的准确性。新能力评估的准确性。


技术研发人员:李冠楠
受保护的技术使用者:企知道科技有限公司
技术研发日:2023.07.14
技术公布日:2023/10/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐