一种政策精准推荐方法、系统及介质与流程
未命名
09-22
阅读:77
评论:0
1.本发明涉及政策推荐技术领域,具体涉及一种政策精准推荐方法、系统及介质。
背景技术:
2.企业和个人的创新是社会进步的动力来源,为了扶持企业和个人在技术创新上的投入,各级单位均颁布一些激励性政策,从而使得企业和个人得到政策性支持。
3.目前的政策推荐方法自动化特征不够明显,政策和企业数据需要人工打标签,自动化程度低,且人工提取数据的浅层特征不够丰富,容易遗弃掉许多有用的信息。同时,现有的政策推荐方法属于基本内容的推荐,只考虑对象的本身性质,将对象按标签形成集合,无法体现个性化因素。
技术实现要素:
4.针对现有技术中的缺陷,本发明提供一种政策精准推荐方法、系统及介质。
5.第一方面,一种政策精准推荐方法,包括:
6.获取待处理信息,所述待处理信息包括政策文件和企业信息;
7.对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征;
8.根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度;
9.基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数;
10.根据所述文本相似度和匹配指数向企业进行政策精准推荐。
11.进一步地,所述对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征,具体为:
12.获取预设的文本处理标准,基于所述文本处理标准对所述政策文件和企业信息进行文本预处理,以提取政策标签特征和企业标签特征,所述标签特征包括多个标签项和每个标签项所包含的多个标签;
13.对所述政策标签特征和企业标签特征分别进行向量化编码,以获取每个标签对应的特征数值;
14.所述文本预处理包括但不限于去除无用信息、分词处理以及词干提取。
15.进一步地,所述根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度,具体为:
16.根据所述特征数值,计算政策标签特征与企业标签特征之间的距离,根据所述距离得到政策文件与企业信息之间的文本相似度。
17.进一步地,所述基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数,具体为:
18.获取预设的政策推荐规则,所述政策推荐规则包括相似度阈值;
19.判断所述文本相似度是否小于相似度阈值,若是,则进行人工干预推荐;
20.若否,则根据所述政策标签特征和企业标签特征,采用目标算法计算政策文件与企业信息之间的匹配指数,计算公式为:
[0021][0022]
其中,x为政策文件与企业信息之间的综合匹配指数,σ为非线性函数,xi为第i个政策标签项,a为第i个政策标签项的权重参数,n为政策标签项总数量,l为第i个政策标签项所包含的政策标签数量,t为与l个政策标签相匹配的企业标签数量。
[0023]
进一步地,所述根据所述文本相似度和匹配指数向企业进行政策精准推荐,具体为:
[0024]
计算所述相似度与综合匹配指数之间的差值,并判断所述差值是否超过预设的差量阈值;
[0025]
若超过,则进行人工干预推荐;
[0026]
若未超过,则将所述政策文件精准推荐给对应企业。
[0027]
第二方面,一种政策精准推荐系统,包括:
[0028]
信息获取模块:用于获取待处理信息,所述待处理信息包括政策文件和企业信息;
[0029]
文本处理模块:用于对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征;
[0030]
相似计算模块:用于根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度;
[0031]
标签匹配模块:用于基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数;
[0032]
政策推荐模块:用于根据所述文本相似度和匹配指数向企业进行政策精准推荐。
[0033]
进一步地,所述文本处理模块具体用于:
[0034]
获取预设的文本处理标准,基于所述文本处理标准对所述政策文件和企业信息进行文本预处理,以提取政策标签特征和企业标签特征,所述标签特征包括多个标签项和每个标签项所包含的多个标签;
[0035]
对所述政策标签特征和企业标签特征分别进行向量化编码,以获取每个标签对应的特征数值;
[0036]
所述文本预处理包括但不限于去除无用信息、分词处理以及词干提取。
[0037]
进一步地,所述标签匹配模块具体用于:
[0038]
获取预设的政策推荐规则,所述政策推荐规则包括相似度阈值;
[0039]
判断所述文本相似度是否小于相似度阈值,若是,则进行人工干预推荐;
[0040]
若否,则根据所述政策标签特征和企业标签特征,采用目标算法计算政策文件与企业信息之间的匹配指数,计算公式为:
[0041][0042]
其中,x为政策文件与企业信息之间的综合匹配指数,σ为非线性函数,xi为第i个政策标签项,a为第i个政策标签项的权重参数,n为政策标签项总数量,l为第i个政策标签
项所包含的政策标签数量,t为与l个政策标签相匹配的企业标签数量。
[0043]
进一步地,所述政策推荐模块具体用于:
[0044]
计算所述相似度与综合匹配指数之间的差值,并判断所述差值是否超过预设的差量阈值;
[0045]
若超过,则进行人工干预推荐;
[0046]
若未超过,则将所述政策文件精准推荐给对应企业。
[0047]
第三方面,一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如第一方面所述的方法。
[0048]
本发明的有益效果体现在:通过对政策文件和企业信息进行文本处理和向量化编码,得到多个政策标签特征和企业标签特征,基于政策标签特征和企业标签特征进行相似度计算得到文本相似度,对于满足基本推荐条件的进一步计算政策文件与企业信息之间的匹配指数,通过比较文本相似度和匹配指数向企业进行政策精准推荐,推荐过程具有针对性,体现出个性化因素,推荐结果准确可靠,确保推荐的政策能真正满足企业的需求。
附图说明
[0049]
为了更清楚地说明本发明具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍。在所有附图中,类似的元件或部分一般由类似的附图标记标识。附图中,各元件或部分并不一定按照实际的比例绘制。
[0050]
图1为本发明实施例提供的一种政策精准推荐方法的流程图;
[0051]
图2为本发明实施例提供的一种政策精准推荐系统的模块框图。
具体实施方式
[0052]
下面将结合附图对本发明技术方案的实施例进行详细的描述。以下实施例仅用于更加清楚地说明本发明的技术方案,因此只作为示例,而不能以此来限制本发明的保护范围。
[0053]
需要注意的是,除非另有说明,本技术使用的技术术语或者科学术语应当为本发明所属领域技术人员所理解的通常意义。
[0054]
如图1所示,一种政策精准推荐方法,包括:
[0055]
s1:获取待处理信息,所述待处理信息包括政策文件和企业信息;
[0056]
具体地,获取待处理信息,所述待处理信息包括政策文件和企业信息。其中,所述政策文件主要以惠企相关政策为主,包括但不限于优惠措施和补贴政策、服务外包和人才引进政策、产业扶持和创新驱动政策、知识产权保护和创新激励政策、人才培养和引进政策、金融支持和风险防控政策等;所述企业信息包括但不限于企业名称、企业行业分类、企业规模、企业注册地、企业注册资本、企业资质、企业缴纳社保人数、企业缴纳公积金人数等。
[0057]
s2:对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征;
[0058]
具体地,获取人工预设的文本处理标准,基于文本处理标准对政策文件和企业信息进行文本预处理,以提取政策标签特征和企业标签特征,将文本数据转化为计算机可以
识别的形式,所述标签特征包括政策或企业的多个标签项,以及每个标签项所包含的多个标签。优选地,所述政策标签项包括但不限于适用行业、适用企业的行业资质、适用企业的规模、适用企业的知识产权和专利数等;所述企业标签项包括但不限于企业的注册资本、企业的资质、企业的经营范围、企业的参保人数、企业发布的年报等。
[0059]
优选地,所述文本预处理包括但不限于去除无用信息、分词处理、去除停用词、词干提取、词性标注、句法分析以及命名试题识别等,本实施例中,文本预处理所采用的算法包括但不限于自然语言处理法(nlp)和机器学习法(ml)等。
[0060]
对所提取的政策标签特征和企业标签特征分别进行向量化编码,将文本转换为数值表示,进而获取每个标签对应的特征数值,以便后续进行相似度计算。本实施例中,包括但不限于使用词袋模型、tf-idf模型等进行向量化编码。
[0061]
s3:根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度;
[0062]
具体地,根据所述特征数值,基于文本距离计算方法,计算政策标签特征与企业标签特征之间的距离,通过计算所得的距离来衡量政策文件与企业信息之间的文本相似度。优选地,所述文本距离计算方法包括但不限于欧几里得距离计算法、余弦相似度计算法等。
[0063]
s4:基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数;
[0064]
具体地,通过步骤s3所得文本相似度只能判断企业是否满足基本政策推荐条件,即文本相似度仅能反映企业是否基本符合政策申报资格、是否基本适用于该政策,无法达到精准推荐标准,因此需要进一步匹配推荐。
[0065]
在获取文本相似度后,获取预设的政策推荐规则,所述政策推荐规则包括对相似度阈值的设定。判断文本相似度是否小于相似度阈值,若小于,则表示政策与企业之间高度不匹配,进而不需要再进行后续的政策精准匹配。
[0066]
若文本相似度大于相似度阈值,说明满足推荐条件,则根据政策标签特征和企业标签特征,采用目标算法分别计算政策文件的第1个标签至第i个标签与企业信息之间的匹配指数,并将匹配指数之和作为综合匹配指数,计算公式为:
[0067][0068]
式中,x为政策文件与企业信息之间的综合匹配指数,σ为非线性函数,xi为第i个政策标签项,a为第i个政策标签项的权重参数,n为政策标签项总数量,l为第i个政策标签项所包含的政策标签数量,t为与l个政策标签相匹配的企业标签数量。
[0069]
优选地,目标算法计算公式中它可将一个数值映射为(0,1)的区间上,因为特征之间的关系未知,但在真实世界中,特征之间一定不会呈线性关系,因此本实施例通过非线性函数映射后得到一个(0,1)的值,可视为概率,该概率和匹配指数呈正相关。
[0070]
本实施例中,xi为占用位,计算时取值为1,可视为一个特征项。l表示第i个标签项下包含的信息个数,例如:政策文件包括行业标签项,行业标签项中某一行包含“餐饮业、零售业、商务服务业、铁路运输业、道路运输业、水上运输业、航空运输业”7个标签,则l取值为7;假设一个企业与上述7个标签相匹配的企业标签包括“餐饮业、铁路运输业、道路运输业、
水上运输业”4个标签,则t取值为4,则为
[0071]
优选地,表示奖励项,n为政策标签项总数量,a为权重参数,实际运用中可根据政策申报优先级设定a的取值,进而设定当前政策标签项的权重。例如产权类惠企政策对企业的规模、企业的资质、企业的注册资本等更为侧重,则可将对应政策标签项的权重值设为更高的值。
[0072]
s5:根据所述文本相似度和匹配指数向企业进行政策精准推荐;
[0073]
具体地,所述政策推荐规则还包括人工预设的差量阈值,所述差量阈值为相似度和匹配指数允许的最大差值。计算相似度与匹配指数之间的差值,判断该差值是否超过预设的差量阈值,若超过,说明相似度计算结果误差较大,则进行人工干预推荐,获得一个较为匹配的推荐政策;若未超过,说明当前政策文件与企业信息之间匹配程度较高,则将该政策文件精准推荐给对应企业。
[0074]
基于相同的发明构思,本发明实施例还提供了一种政策精准推荐系统,如图2所示,包括:
[0075]
信息获取模块:用于获取待处理信息,所述待处理信息包括政策文件和企业信息;
[0076]
文本处理模块:用于对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征;
[0077]
相似计算模块:用于根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度;
[0078]
标签匹配模块:用于基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数;
[0079]
政策推荐模块:用于根据所述文本相似度和匹配指数向企业进行政策精准推荐。
[0080]
进一步地,所述文本处理模块具体用于:
[0081]
获取预设的文本处理标准,基于所述文本处理标准对所述政策文件和企业信息进行文本预处理,以提取政策标签特征和企业标签特征,所述标签特征包括多个标签项和每个标签项所包含的多个标签;
[0082]
对所述政策标签特征和企业标签特征分别进行向量化编码,以获取每个标签对应的特征数值;
[0083]
所述文本预处理包括但不限于去除无用信息、分词处理以及词干提取。
[0084]
进一步地,所述相似计算模块具体用于:
[0085]
根据所述特征数值,计算政策标签特征与企业标签特征之间的距离,根据所述距离得到政策文件与企业信息之间的文本相似度。
[0086]
进一步地,所述标签匹配模块具体用于:
[0087]
获取预设的政策推荐规则,所述政策推荐规则包括相似度阈值;
[0088]
判断所述文本相似度是否小于相似度阈值,若是,则进行人工干预推荐;
[0089]
若否,则根据所述政策标签特征和企业标签特征,采用目标算法计算政策文件与企业信息之间的匹配指数,计算公式为:
[0090][0091]
其中,x为政策文件与企业信息之间的综合匹配指数,σ为非线性函数,xi为第i个政策标签项,a为第i个政策标签项的权重参数,n为政策标签项总数量,l为第i个政策标签项所包含的政策标签数量,t为与l个政策标签相匹配的企业标签数量。
[0092]
进一步地,所述政策推荐模块具体用于:
[0093]
计算所述相似度与综合匹配指数之间的差值,并判断所述差值是否超过预设的差量阈值;
[0094]
若超过,则进行人工干预推荐;
[0095]
若未超过,则将所述政策文件精准推荐给对应企业。
[0096]
需要说明的是,关于一种政策精准推荐系统更为具体的工作流程,请参考前述方法实施例部分,在此不在赘述。
[0097]
本发明通过对政策文件和企业信息进行文本处理和向量化编码,得到多个政策标签特征和企业标签特征,基于政策标签特征和企业标签特征进行相似度计算得到文本相似度,对于满足基本推荐条件的进一步计算政策文件与企业信息之间的匹配指数,通过比较文本相似度和匹配指数向企业进行政策精准推荐,推荐过程具有针对性,体现出个性化因素,推荐结果准确可靠,确保推荐的政策能真正满足企业的需求。
[0098]
进一步地,本发明实施例还提供了一种可读存储介质,存储有计算机程序,所述计算机程序包括程序指令,所述程序指令被处理器执行时实现:上述政策精准推荐方法。
[0099]
所述计算机可读存储介质可以是前述实施例所述的后台服务器的内部存储单元,例如系统的硬盘或内存。所述计算机可读存储介质也可以是所述系统的外部存储设备,例如所述系统上配备的插接式硬盘,智能存储卡(smart media card,smc),安全数字(secure digital,sd)卡,闪存卡(flash card)等。进一步地,所述计算机可读存储介质还可以既包括所述系统的内部存储单元也包括外部存储设备。所述计算机可读存储介质用于存储所述计算机程序以及所述系统所需的其他程序和数据。所述计算机可读存储介质还可以用于暂时地存储已经输出或者将要输出的数据。
[0100]
本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、计算机软件或者二者的结合来实现,为了清楚地说明硬件和软件的可互换性,在上述说明中已经按照功能一般性地描述了各示例的组成及步骤。这些功能究竟以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本发明的范围。
[0101]
另外,在本发明各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以是两个或两个以上单元集成在一个单元中。上述集成的单元既可以采用硬件的形式实现,也可以采用软件功能单元的形式实现。
[0102]
所述集成的单元如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本发明的技术方案本质上或者说对现有技术做出贡献的部分,或者该技术方案的全部或部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机
设备(可以是个人计算机,服务器,或者网络设备等)执行本发明各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(rom,read-only memory)、随机存取存储器(ram,random access memory)、磁碟或者光盘等各种可以存储程序代码的介质。
[0103]
以上所述,仅为本发明的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,可轻易想到各种等效的修改或替换,这些修改或替换都应涵盖在本发明的保护范围之内。因此,本发明的保护范围应以权利要求的保护范围为准。
技术特征:
1.一种政策精准推荐方法,其特征在于,包括:获取待处理信息,所述待处理信息包括政策文件和企业信息;对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征;根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度;基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数;根据所述文本相似度和匹配指数向企业进行政策精准推荐。2.根据权利要求1所述的一种政策精准推荐方法,其特征在于,所述对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征,具体为:获取预设的文本处理标准,基于所述文本处理标准对所述政策文件和企业信息进行文本预处理,以提取政策标签特征和企业标签特征,所述标签特征包括多个标签项和每个标签项所包含的多个标签;对所述政策标签特征和企业标签特征分别进行向量化编码,以获取每个标签对应的特征数值;所述文本预处理包括但不限于去除无用信息、分词处理以及词干提取。3.根据权利要求2所述的一种政策精准推荐方法,其特征在于,所述根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度,具体为:根据所述特征数值,计算政策标签特征与企业标签特征之间的距离,根据所述距离得到政策文件与企业信息之间的文本相似度。4.根据权利要求3所述的一种政策精准推荐方法,其特征在于,所述基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数,具体为:获取预设的政策推荐规则,所述政策推荐规则包括相似度阈值;判断所述文本相似度是否小于相似度阈值,若是,则进行人工干预推荐;若否,则根据所述政策标签特征和企业标签特征,采用目标算法计算政策文件与企业信息之间的匹配指数,计算公式为:其中,x为政策文件与企业信息之间的综合匹配指数,σ为非线性函数,x
i
为第i个政策标签项,a为第i个政策标签项的权重参数,n为政策标签项总数量,l为第i个政策标签项所包含的政策标签数量,t为与l个政策标签相匹配的企业标签数量。5.根据权利要求4所述的一种政策精准推荐方法,其特征在于,所述根据所述文本相似度和匹配指数向企业进行政策精准推荐,具体为:计算所述相似度与综合匹配指数之间的差值,并判断所述差值是否超过预设的差量阈值;若超过,则进行人工干预推荐;若未超过,则将所述政策文件精准推荐给对应企业。6.一种政策精准推荐系统,其特征在于,包括:
信息获取模块:用于获取待处理信息,所述待处理信息包括政策文件和企业信息;文本处理模块:用于对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征;相似计算模块:用于根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度;标签匹配模块:用于基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数;政策推荐模块:用于根据所述文本相似度和匹配指数向企业进行政策精准推荐。7.根据权利要求6所述的一种政策精准推荐系统,其特征在于,所述文本处理模块具体用于:获取预设的文本处理标准,基于所述文本处理标准对所述政策文件和企业信息进行文本预处理,以提取政策标签特征和企业标签特征,所述标签特征包括多个标签项和每个标签项所包含的多个标签;对所述政策标签特征和企业标签特征分别进行向量化编码,以获取每个标签对应的特征数值;所述文本预处理包括但不限于去除无用信息、分词处理以及词干提取。8.根据权利要求7所述的一种政策精准推荐系统,其特征在于,所述标签匹配模块具体用于:获取预设的政策推荐规则,所述政策推荐规则包括相似度阈值;判断所述文本相似度是否小于相似度阈值,若是,则进行人工干预推荐;若否,则根据所述政策标签特征和企业标签特征,采用目标算法计算政策文件与企业信息之间的匹配指数,计算公式为:其中,x为政策文件与企业信息之间的综合匹配指数,σ为非线性函数,x
i
为第i个政策标签项,a为第i个政策标签项的权重参数,n为政策标签项总数量,l为第i个政策标签项所包含的政策标签数量,t为与l个政策标签相匹配的企业标签数量。9.根据权利要求8所述的一种政策精准推荐系统,其特征在于,所述政策推荐模块具体用于:计算所述相似度与综合匹配指数之间的差值,并判断所述差值是否超过预设的差量阈值;若超过,则进行人工干预推荐;若未超过,则将所述政策文件精准推荐给对应企业。10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机程序,所述计算机程序包括程序指令,所述程序指令当被处理器执行时使所述处理器执行如权利要求1-5任一项所述的方法。
技术总结
本发明公开了一种政策精准推荐方法、系统及介质,方法包括:获取待处理信息,所述待处理信息包括政策文件和企业信息;对所述待处理信息进行文本处理,以提取政策标签特征和企业标签特征;根据所述政策标签特征和企业标签特征进行相似性计算,以获取政策文件与企业信息之间的文本相似度;基于所述文本相似度,根据政策标签特征和企业标签特征计算政策文件与企业信息之间的匹配指数;根据所述文本相似度和匹配指数向企业进行政策精准推荐。本发明基于政策文件和企业信息进行文本预处理,并计算政策文件与企业信息之间的文本相似度和匹配指数,根据文本相似度和匹配指数向企业进行政策精准推荐,体现个性化因素,确保推荐的政策能真正满足企业需求。真正满足企业需求。真正满足企业需求。
技术研发人员:古顺天 彭曈曈
受保护的技术使用者:数字重庆政务科技有限公司
技术研发日:2023.06.25
技术公布日:2023/9/20
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/