一种基于大数据特征识别的文字近似度检索分析方法与流程
未命名
09-26
阅读:143
评论:0

1.本发明涉及文字识别技术领域,尤其涉及一种基于大数据特征识别的文字近似度检索分析方法。
背景技术:
2.商标作为企业的一种无形资本,对企业的生存发展具有重要的作用。在这种情况下,各行各业的企业都争先进行企业商标注册。对于单纯以文字类型注册的商标来说,由于汉字形体结构的特点,使得汉字存在众多的形近字,这就导致文字注册商标中经常出现相近商标,在出现相近商标的情况下,就需要对相近商标进行近似审核,在进行近似审核过程中就需要用到文字近似度检索分析方法。
3.目前的文字近似度检索分析方法大部分都是以待近似检索文字本身的偏旁部件作为近似度检索分析依据进行近似度检索分析,这种近似度检索分析方式由于检索分析依据单一,一方面只能检索到与待近似检索文字具有相同偏旁部件的文字,对于一些与待近似检索文字具有的偏旁部件不同但整体形状相似的文字通常会遗漏检索,导致检索范围有限。
技术实现要素:
4.本发明的目的是为了解决目前的文字识别效果差,不能对形体相似的文字进行遗漏检索,使用效果差的缺点,而提出的一种基于大数据特征识别的文字近似度检索分析方法。
5.为了实现上述目的,本发明采用了如下技术方案:
6.一种基于大数据特征识别的文字近似度检索分析方法,包括以下步骤:
7.s1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;
8.s2:录入需要识别的文字数据;
9.s3:提取文字数据按照结构、笔画进行分类;
10.s4:将分类后的文字与模板进行对比;
11.s5:设置对比相似度比例值为50-70%;
12.s6:进行二次对比,并将对比值设置为71-99%;
13.s7:对文字综合近似度进行分析;
14.s8:将识别后文字进行排序显示。
15.优选的,所述s1中,建立候选文字模板并按照结构、笔画进行分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和右下。
16.优选的,所述s1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3
……
n进行标号。
17.优选的,所述s2中,将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;
18.拍照录入采用图片文字提取的方式获取文字数据;
19.语音录入采用语音提取的方式获取文字数据;
20.人工键盘输入通过人工对文字数据进行录入。
21.优选的,所述s3中,将获取的文字数据按照结构、笔画进行分类,结构分类包括上下结构、左右结构、包围结构进行分类,笔画分类包括1-10笔画、11-20笔画、21-n笔画进行分类。
22.优选的,所述s4中,将分类的文字与模板进行对比,首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,最后,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对。
23.优选的,所述s5中,比对后按照50-70%的比对值,获取第一次对比的文字数据,删除剔除的文字数据。
24.优选的,所述s6中,将第一次对比的文字数据按照71-99%的比对值进行对比,获取第二次对比的文字数据。
25.优选的,所述s7中,对获取的文字进行分析,判断合格率,合格率设置在90-100%。
26.优选的,所述s8中,将识别后的文字进行排布显示。
27.与现有技术相比,本发明的优点在于:
28.本发明建立模板,并将录入的文字进行分类对比,采用二次对比,提高对比准确率,同时设置的比例值可以进行更改,提高对文字的检索分析识别效果。
附图说明
29.图1为本发明提出的一种基于大数据特征识别的文字近似度检索分析方法的流程图。
具体实施方式
30.下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。
31.实施例一
32.参照图1,一种基于大数据特征识别的文字近似度检索分析方法,包括以下步骤:
33.s1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;
34.s2:录入需要识别的文字数据;
35.s3:提取文字数据按照结构、笔画进行分类;
36.s4:将分类后的文字与模板进行对比;
37.s5:设置对比相似度比例值为50-70%;
38.s6:进行二次对比,并将对比值设置为71-99%;
39.s7:对文字综合近似度进行分析;
40.s8:将识别后文字进行排序显示。
41.本实施例中,分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和右下。
42.本实施例中,s1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安
装1、2、3
……
n进行标号。
43.本实施例中,s2中,将需要识别的文字数据进行拍照录入;拍照录入采用图片文字提取的方式获取文字数据。
44.本实施例中,s3中,将获取的文字数据按照结构、笔画进行分类,结构分类包括上下结构、左右结构、包围结构进行分类,笔画分类包括1-10笔画、11-20笔画、21-n笔画进行分类。
45.本实施例中,s4中,将分类的文字与模板进行对比,首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,最后,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对。
46.本实施例中,s5中,比对后按照50-70%的比对值,获取第一次对比的文字数据,删除剔除的文字数据。
47.本实施例中,s6中,将第一次对比的文字数据按照71-99%的比对值进行对比,获取第二次对比的文字数据。
48.本实施例中,s7中,对获取的文字进行分析,判断合格率,合格率设置在90-100%。
49.本实施例中,s8中,将识别后的文字进行排布显示。
50.实施例二
51.参照图1,一种基于大数据特征识别的文字近似度检索分析方法,包括以下步骤:
52.s1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;
53.s2:录入需要识别的文字数据;
54.s3:提取文字数据按照结构、笔画进行分类;
55.s4:将分类后的文字与模板进行对比;
56.s5:设置对比相似度比例值为50-70%;
57.s6:进行二次对比,并将对比值设置为71-99%;
58.s7:对文字综合近似度进行分析;
59.s8:将识别后文字进行排序显示。
60.本实施例中,分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和右下。
61.本实施例中,s1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3
……
n进行标号。
62.本实施例中,s2中,将需要识别的文字数据进行语音录入;语音录入采用语音提取的方式获取文字数据。
63.实施例三
64.参照图1,一种基于大数据特征识别的文字近似度检索分析方法,包括以下步骤:
65.s1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;
66.s2:录入需要识别的文字数据;
67.s3:提取文字数据按照结构、笔画进行分类;
68.s4:将分类后的文字与模板进行对比;
69.s5:设置对比相似度比例值为50-70%;
70.s6:进行二次对比,并将对比值设置为71-99%;
71.s7:对文字综合近似度进行分析;
72.s8:将识别后文字进行排序显示。
73.本实施例中,分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和右下。
74.本实施例中,s1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3
……
n进行标号。
75.本实施例中,s2中,将需要识别的文字数据进行人工键盘输入,通过人工对文字数据进行录入。
76.以上所述,仅为本发明较佳的具体实施方式,但本发明的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本发明揭露的技术范围内,根据本发明的技术方案及其发明构思加以等同替换或改变,都应涵盖在本发明的保护范围之内。
技术特征:
1.一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,包括以下步骤:s1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;s2:录入需要识别的文字数据;s3:提取文字数据按照结构、笔画进行分类;s4:将分类后的文字与模板进行对比;s5:设置对比相似度比例值为50-70%;s6:进行二次对比,并将对比值设置为71-99%;s7:对文字综合近似度进行分析;s8:将识别后文字进行排序显示。2.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s1中,建立候选文字模板并按照结构、笔画进行分类建模,建模的文字设置三点坐标,三点坐标依次为上方、左下和右下。3.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s1中,将建立的文字制作为图片形式进行保存,将建立的文字图片安装1、2、3
……
n进行标号。4.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s2中,将需要识别的文字数据进行录入,录入方式包括:拍照录入、语音录入、人工键盘输入;拍照录入采用图片文字提取的方式获取文字数据;语音录入采用语音提取的方式获取文字数据;人工键盘输入通过人工对文字数据进行录入。5.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s3中,将获取的文字数据按照结构、笔画进行分类,结构分类包括上下结构、左右结构、包围结构进行分类,笔画分类包括1-10笔画、11-20笔画、21-n笔画进行分类。6.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s4中,将分类的文字与模板进行对比,首先,将获取的文字数据安装结构分类归纳到结构类模板,然后,安装笔画进行分类,归纳到笔画类模板,最后,将文字数据与模板进行比对,采用三点定位,然后进行逐个比对。7.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s5中,比对后按照50-70%的比对值,获取第一次对比的文字数据,删除剔除的文字数据。8.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s6中,将第一次对比的文字数据按照71-99%的比对值进行对比,获取第二次对比的文字数据。9.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s7中,对获取的文字进行分析,判断合格率,合格率设置在90-100%。10.根据权利要求1所述的一种基于大数据特征识别的文字近似度检索分析方法,其特征在于,所述s8中,将识别后的文字进行排布显示。
技术总结
本发明属于文字识别技术领域,尤其是一种基于大数据特征识别的文字近似度检索分析方法,针对目前的文字识别效果差,不能对形体相似的文字进行遗漏检索,使用效果差的问题,现提出如下方案,其包括以下步骤:S1:建立候选文字识别模板,按照文字的结构、笔画进行分类建模;S2:录入需要识别的文字数据;S3:提取文字数据按照结构、笔画进行分类;S4:将分类后的文字与模板进行对比;S5:设置对比相似度比例值为50-70%;S6:进行二次对比。本发明建立模板,并将录入的文字进行分类对比,采用二次对比,提高对比准确率,同时设置的比例值可以进行更改,提高对文字的检索分析识别效果。提高对文字的检索分析识别效果。
技术研发人员:余就裕 崔龙强 黎远伟
受保护的技术使用者:深圳高新邦科技有限公司
技术研发日:2022.03.14
技术公布日:2023/9/23
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
飞机超市 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/