一种文本转换方法、装置、计算机设备与流程
未命名
10-21
阅读:61
评论:0
1.本技术涉及数据处理技术领域,特别是涉及一种文本转换方法、装置、计算机设备、存储介质和计算机程序产品。
背景技术:
2.对一些敏感信息的存储,例如密码、个人信息等,一般不会直接存储至数据库中,而是会通过各种算法进行加密、解密。
3.不同的用户或系统可能需要不同的编码方式,相关技术中,通过用户手动选择目标编码的方式进行编码,难以提高编码转换的效率。
技术实现要素:
4.基于此,有必要针对上述技术问题,提供了一种文本转换方法,可以根据目标文本的特征获取目标文本的原始编码方式,根据原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本,再进行格式转换。可以提高文本转换的准确性和效率。
5.第一方面,本技术提供了一种文本转换方法。所述方法包括:
6.获取目标文本及待转换的目标编码方式,对所述目标文本进行文本特征提取,得到目标文本的特征;
7.将所述特征输入预先构建的识别模型,得到所述目标文本的原始编码方式;
8.根据所述原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本;
9.根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。
10.在其中一个实施例中,所述预先构建的识别模型的生成方式包括:
11.获取不同类型的文本,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记;
12.对所述文本进行文本特征提取,所述文本特征与所述编码标记相对应;
13.根据所述文本特征与所述编码标记进行训练,得到所述预先构建的识别模型。
14.在其中一个实施例中,所述获取目标文本之前,还包括:
15.获取待处理数据,将所述待处理数据转换为目标文本,所述待处理数据包括语音数据、文本数据、视频数据。
16.在其中一个实施例中,所述使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记包括:
17.对所述编码方式进行标签化处理,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记,得到标签与所述编码标记的映射关系。
18.在其中一个实施例中,将所述特征输入预先构建的识别模型,得到目标文本的编码方式包括:
19.所述预先构建的识别模型根据所述特征得到相匹配的编码标记,根据所述标签与
所述编码标记的映射关系获取目标文本的标签,得到目标文本的编码方式。
20.第二方面,本技术还提供了一种文本转换装置,所述装置包括:
21.提取模块,用于获取目标文本及待转换的目标编码方式,对所述目标文本进行文本特征提取,得到目标文本的特征;
22.识别模块,用于将所述特征输入预先构建的识别模型,得到目标文本数据的原始编码方式;
23.解码模块,用于根据所述原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本;
24.编码模块,用于根根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。
25.在其中一个实施例中,所述预先构建的识别模型的生成方式包括:
26.获取不同类型的文本,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记;
27.对所述文本进行文本特征提取,所述文本特征与所述编码标记相对应;
28.根据所述文本特征与所述编码标记进行训练,得到所述预先构建的识别模型。
29.在其中一个实施例中,所述获取目标文本之前,还包括:
30.获取待处理数据,将所述待处理数据转换为目标文本,所述待处理数据包括语音数据、文本数据、视频数据。
31.在其中一个实施例中,所述使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记包括:
32.对所述编码方式进行标签化处理,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记,得到标签与所述编码标记的映射关系。
33.在其中一个实施例中,将所述特征输入预先构建的识别模型,得到目标文本的编码方式包括:
34.所述预先构建的识别模型根据所述特征得到相匹配的编码标记,根据所述标签与所述编码标记的映射关系获取目标文本的标签,得到目标文本的编码方式。
35.第三方面,本公开还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现文本转换方法的步骤。
36.第四方面,本公开还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现文本转换方法的步骤。
37.第五方面,本公开还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现文本转换方法的步骤。
38.上述文本转换方法,至少包括以下有益效果:
39.本公开提供的实施例方案,可以提取目标文本的特征,根据目标文本的特征获取目标文本的原始编码方式,根据原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本,根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。可以提高文本转换的准确性和效率。
40.应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不
能限制本公开。
附图说明
41.为了更清楚地说明本公开实施例或传统技术中的技术方案,下面将对实施例或传统技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本公开的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
42.图1为一个实施例中文本转换方法的应用环境图;
43.图2为一个实施例中文本转换方法的流程示意图;
44.图3为一个实施例中文本转换方法的流程示意图;
45.图4为一个实施例中文本转换装置的结构框图;
46.图5为一个实施例中文本转换装置的结构框图;
47.图6为一个实施例中计算机设备的内部结构图;
48.图7为一个实施例中一种服务器的内部结构图。
具体实施方式
49.为了使本领域普通人员更好地理解本公开的技术方案,下面将结合附图,对本公开实施例中的技术方案进行清楚、完整地描述。
50.需要说明的是,本公开的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本公开的实施例能够以除了在这里图示或描述的那些以外的顺序实施。以下示例性实施例中所描述的实施方式并不代表与本公开相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本公开的一些方面相一致的装置和方法的例子。术语“包括”、“包含”或者其任何其它变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、产品或者设备不仅包括那些要素,而且还包括没有明确列出的其它要素,或者是还包括为这种过程、方法、产品或者设备所固有的要素。在没有更多限制的情况下,并不排除在包括所述要素的过程、方法、产品或者设备中还存在另外的相同或等同要素。例如若使用到第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
51.本公开实施例提供一种文本转换方法,可以应用于如图1所示的应用环境中。其中,终端102通过网络与服务器104进行通信。数据存储系统可以存储服务器104需要处理的数据。数据存储系统可以集成在服务器104上,也可以放在云上或其他网络服务器上。其中,终端102可以但不限于是各种个人计算机、笔记本电脑、智能手机、平板电脑、物联网设备和便携式可穿戴设备,物联网设备可为智能音箱、智能电视、智能空调、智能车载设备等。便携式可穿戴设备可为智能手表、智能手环、头戴设备等。服务器104可以用独立的服务器或者是多个服务器组成的服务器集群来实现。
52.在本公开的一些实施例中,如图2所示,提供了一种文本转换方法,以该方法应用于图1中的服务器对目标文本进行处理为例进行说明。可以理解的是,该方法可以应用于服务器,还可以应用于包括终端和服务器的系统,并通过终端和服务器的交互实现。具体的一
个实施例中,所述方法可以包括以下步骤:
53.s202:获取目标文本及待转换的目标编码方式,对所述目标文本进行文本特征提取,得到目标文本的特征。
54.目标文本可以是多个包含文本的图像、视频、音频,通过文本检测模型检测得到,在获取到目标文本后,可以对目标文本进行清洗,例如填充缺失值、去重重复数据、格式修改等。编码对应于计算机的识别方法,根据该识别方法可以将编码与自然语言的字符相对应,与计算机能够识别的二进制数字相对应,字符编码可以将符号、数字、字母等转换为计算机可以识别的二进制编码。编码方式可以包括ascii、utf-8、gbk等。
55.不同的编码方式的规则不同,对目标文本进行文本特征提取,得到目标文本的特征,进而得到目标文本的原始编码方式。
56.可以对每个字节的值进行特征提取,可能会出现连续字节的模式或特殊字符的情况,可以对连续字节的模式进行分析并作为模式特征,可以确定特殊字符的位置并作为位置特征,特征与编码方式相对应。
57.s204:将所述特征输入预先构建的识别模型,得到所述目标文本的原始编码方式。
58.可以将采用卷积神经网络(convolutional neural networks,cnn)或者长短期记忆网络(long short-term memory,lstm)作为预先构建的识别模型,可以使用预先构建的特征以及编码方式对识别模型进行训练,提高模型的识别精度与稳定性。
59.特征与编码方式相对应,将特征输入预先构建的识别模型,可以得到目标文本的原始编码方式。
60.s206:根据所述原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本。
61.根据模型识别出的编码方式,确定原始的编码方式。例如,在python中,可以使用str.decode(encoding)方法来解码原始的编码方式,其中encoding就是模型预测出的原始的编码方式。通过原始编码方式对应的解码方式,可以得到原始文本。
62.在本公开的一些实施例中,目标文本可能是01000001,首先可以检测目标文本的格式,再检测目标文本的长度,得到与之相匹配的编码方式,通过目标文本的特征可以得到目标文本的原始编码方式为ascii码,根据ascii码的对照表得到原始文本为a。
63.s208:根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。
64.可以根据目标编码重新对原始文本进行编码,根据目标编码更改原始文本的格式。
65.在客户端与服务端的编码方式不同时,服务端在接收到客户端上传的文本后,可能会将文本识别为乱码。例如,字符“zero width no-break space”表示的是空格符的意思,在ucs中可以该字符对应的编码为feff,但feff在ucs中是不存在的字符,在实际的传输过程中,需要对编码进行转换,便于系统识别出编码对应的文本。
66.上述文本转换方法中,可以提取目标文本的特征,根据目标文本的特征获取目标文本的原始编码方式,根据原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本,根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。可以提高文本转换的准确性和效率。
67.在本公开的一些实施例中,预先构建的识别模型的生成方式包括:
68.获取不同类型的文本,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记;
69.对所述文本进行文本特征提取,所述文本特征与所述编码标记相对应;
70.根据所述文本特征与所述编码标记进行训练,得到所述预先构建的识别模型。
71.可以获取不同类型的文本,使用不同的编码方式对所述文本进行编码。例如,一共有1000个文本集,分别使用不同的编码方式对文本进行编码,最终每一个文本集得到多个编码后的文本,对多个编码后的文本进行编码标记。
72.文本特征与编码标记相对应,可以根据所述文本特征与所述编码标记进行训练,得到所述预先构建的识别模型,采用adam等优化算法进行模型参数的优化,并使用交叉验证等方式来验证模型的性能,确保模型的识别精度和稳定性。
73.图3为一个实施例中文本转换方法的流程示意图。
74.在本公开的一些实施例中,所述获取目标文本之前,还包括:
75.s302:获取待处理数据,将所述待处理数据转换为目标文本,所述待处理数据包括语音数据、文本数据、视频数据。
76.在本公开的一些实施例中,所述使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记包括:
77.对所述编码方式进行标签化处理,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记,得到标签与所述编码标记的映射关系。
78.为每种编码方式创建标签的过程中,我们可以为每种编码方式指定一个唯一的标识符,这个标识符就是对应编码方式的标签。比如,可以用数字标签来表示不同的编码方式。utf-8编码:标签为0,iso-8859-1编码:标签为1,gbk编码:标签为2,shift_jis编码:标签为3,big5编码:标签为4。这些标签可以用于训练深度学习模型。在训练过程中,模型会尝试学习从输入的文本和标签的映射关系。例如,如果一个文本是utf-8编码的,那么模型就需要学习将这个文本映射到标签0。为编码方式创建标签并不是唯一的方式,实际的标签设计可能会根据具体的应用场景和需求进行调整。例如,也可以使用更直观的字符串标签,如"utf-8"、"iso-8859-1"等。
79.在本公开的一些实施例中,将所述特征输入预先构建的识别模型,得到目标文本的编码方式包括:
80.所述预先构建的识别模型根据所述特征得到相匹配的编码标记,根据所述标签与所述编码标记的映射关系获取目标文本的标签,得到目标文本的编码方式。
81.文本的编码方式对应特定的标签,例如utf-8编码对应的标签为0,可以对编码后的文本进行编码标记,编码标记可以设置为00,对文本进行文本特征提取,得到文本的特征,将特征输入预先构建的识别模型,得到文本的编码方式为00,进而得到标签为0,对应的编码方式为utf-8。
82.应该理解的是,虽然如上所述的各实施例所涉及的流程图中的各个步骤按照箭头的指示依次显示,但是这些步骤并不是必然按照箭头指示的顺序依次执行。除非本文中有明确的说明,这些步骤的执行并没有严格的顺序限制,这些步骤可以以其它的顺序执行。而且,如上所述的各实施例所涉及的流程图中的至少一部分步骤可以包括多个步骤或者多个
阶段,这些步骤或者阶段并不必然是在同一时刻执行完成,而是可以在不同的时刻执行,这些步骤或者阶段的执行顺序也不必然是依次进行,而是可以与其它步骤或者其它步骤中的步骤或者阶段的至少一部分轮流或者交替地执行。
83.基于同样的发明构思,本公开实施例还提供了一种用于实现上述所涉及的针对文本转换方法的文本转换装置。该装置所提供的解决问题的实现方案与上述方法中所记载的实现方案相似,故下面所提供的文本转换装置实施例中的具体限定可以参见上文中对于文本转换方法的限定,在此不再赘述。
84.所述装置可以包括使用了本说明书实施例所述方法的系统(包括分布式系统)、软件(应用)、模块、组件、服务器、客户端等并结合必要的实施硬件的装置。基于同一创新构思,本公开实施例提供的一个或多个实施例中的装置如下面的实施例所述。由于装置解决问题的实现方案与方法相似,因此本说明书实施例具体的装置的实施可以参见前述方法的实施,重复之处不再赘述。以下所使用的,术语“单元”或者“模块”可以实现预定功能的软件和/或硬件的组合。尽管以下实施例所描述的装置较佳地以软件来实现,但是硬件,或者软件和硬件的组合的实现也是可能并被构想的。
85.在一个实施例中,如图4所示,提供了一种文本转换装置400,所述装置可以为前述服务器,或者集成于所述服务器的模块、组件、器件、单元等。该装置400可以包括:
86.提取模块402,用于获取目标文本及待转换的目标编码方式,对所述目标文本进行文本特征提取,得到目标文本的特征;
87.识别模块404,用于将所述特征输入预先构建的识别模型,得到目标文本数据的编码方式;
88.解码模块406,用于根据所述原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本;
89.编码模块408,用于根根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。
90.在其中一个实施例中,所述预先构建的识别模型的生成方式包括:
91.获取不同类型的文本,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记;
92.对所述文本进行文本特征提取,所述文本特征与所述编码标记相对应;
93.根据所述文本特征与所述编码标记进行训练,得到所述预先构建的识别模型。
94.图5为一个实施例中文本转换装置的结构框图。在其中一个实施例中,所述获取目标文本之前,还包括:
95.处理模块502,用于获取待处理数据,将所述待处理数据转换为目标文本,所述待处理数据包括语音数据、文本数据、视频数据。
96.在其中一个实施例中,所述使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记包括:
97.对所述编码方式进行标签化处理,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记,得到标签与所述编码标记的映射关系。
98.在其中一个实施例中,将所述特征输入预先构建的识别模型,得到目标文本的编码方式包括:
99.所述预先构建的识别模型根据所述特征得到相匹配的编码标记,根据所述标签与所述编码标记的映射关系获取目标文本的标签,得到目标文本的编码方式。
100.关于上述实施例中的装置,其中各个模块执行操作的具体方式已经在有关该方法的实施例中进行了详细描述,此处将不做详细阐述说明。
101.上述针对文本转换装置中的各个模块可全部或部分通过软件、硬件及其组合来实现。上述各模块可以硬件形式内嵌于或独立于计算机设备中的处理器中,也可以以软件形式存储于计算机设备中的存储器中,以便于处理器调用执行以上各个模块对应的操作。
102.在一个实施例中,提供了一种计算机设备,该计算机设备可以是服务器,其内部结构图可以如图6所示。该计算机设备包括通过系统总线连接的处理器、存储器和网络接口。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质和内存储器。该非易失性存储介质存储有操作系统、计算机程序和数据库。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的数据库用于存储目标文本。该计算机设备的网络接口用于与外部的终端通过网络连接通信。该计算机程序被处理器执行时以实现一种文本转换方法。
103.在一个实施例中,提供了一种计算机设备,该计算机设备可以是终端,其内部结构图可以如图7所示。该计算机设备包括通过系统总线连接的处理器、存储器、通信接口、显示屏和输入装置。其中,该计算机设备的处理器用于提供计算和控制能力。该计算机设备的存储器包括非易失性存储介质、内存储器。该非易失性存储介质存储有操作系统和计算机程序。该内存储器为非易失性存储介质中的操作系统和计算机程序的运行提供环境。该计算机设备的通信接口用于与外部的终端进行有线或无线方式的通信,无线方式可通过wifi、移动蜂窝网络、nfc(近场通信)或其他技术实现。该计算机程序被处理器执行时以实现文本转换方法。该计算机设备的显示屏可以是液晶显示屏或者电子墨水显示屏,该计算机设备的输入装置可以是显示屏上覆盖的触摸层,也可以是计算机设备外壳上设置的按键、轨迹球或触控板,还可以是外接的键盘、触控板或鼠标等。
104.本领域技术人员可以理解,图6、图7中示出的结构,仅仅是与本公开方案相关的部分结构的框图,并不构成对本公开方案所应用于其上的计算机设备的限定,具体的计算机设备可以包括比图中所示更多或更少的部件,或者组合某些部件,或者具有不同的部件布置。
105.在一个实施例中,提供了一种计算机可读存储介质,其上存储有计算机程序,计算机程序被处理器执行时实现本公开任一实施例所述的方法。
106.在一个实施例中,提供了一种计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现本公开任一实施例所述的方法。
107.本领域普通技术人员可以理解实现上述实施例方法中的全部或部分流程,是可以通过计算机程序来指令相关的硬件来完成,所述的计算机程序可存储于一非易失性计算机可读取存储介质中,该计算机程序在执行时,可包括如上述各方法的实施例的流程。其中,本公开所提供的各实施例中所使用的对存储器、数据库或其它介质的任何引用,均可包括非易失性和易失性存储器中的至少一种。非易失性存储器可包括只读存储器(read-only memory,rom)、磁带、软盘、闪存、光存储器、高密度嵌入式非易失性存储器、阻变存储器(reram)、磁变存储器(magnetoresistive random access memory,mram)、铁电存储器
(ferroelectric random access memory,fram)、相变存储器(phase change memory,pcm)、石墨烯存储器等。易失性存储器可包括随机存取存储器(random access memory,ram)或外部高速缓冲存储器等。作为说明而非局限,ram可以是多种形式,比如静态随机存取存储器(static random access memory,sram)或动态随机存取存储器(dynamic random access memory,dram)等。本公开所提供的各实施例中所涉及的数据库可包括关系型数据库和非关系型数据库中至少一种。非关系型数据库可包括基于区块链的分布式数据库等,不限于此。本公开所提供的各实施例中所涉及的处理器可为通用处理器、中央处理器、图形处理器、数字信号处理器、可编程逻辑器、基于量子计算的数据处理逻辑器等,不限于此。
108.以上实施例的各技术特征可以进行任意的组合,为使描述简洁,未对上述实施例中的各个技术特征所有可能的组合都进行描述,然而,只要这些技术特征的组合不存在矛盾,都应当认为是本说明书记载的范围。
109.以上所述实施例仅表达了本公开的几种实施方式,其描述较为具体和详细,但并不能因此而理解为对本公开专利范围的限制。应当指出的是,对于本领域的普通技术人员来说,在不脱离本公开构思的前提下,还可以做出若干变形和改进,这些都属于本公开的保护范围。因此,本公开的保护范围应以所附权利要求为准。
技术特征:
1.一种文本转换方法,其特征在于,所述方法包括:获取目标文本及待转换的目标编码方式,对所述目标文本进行文本特征提取,得到目标文本的特征;将所述特征输入预先构建的识别模型,得到所述目标文本的原始编码方式;根据所述原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本;根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。2.根据权利要求1所述的方法,其特征在于,所述预先构建的识别模型的生成方式包括:获取不同类型的文本,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记;对所述文本进行文本特征提取,所述文本特征与所述编码标记相对应;根据所述文本特征与所述编码标记进行训练,得到所述预先构建的识别模型。3.根据权利要求1所述的方法,其特征在于,所述获取目标文本之前,还包括:获取待处理数据,将所述待处理数据转换为目标文本,所述待处理数据包括语音数据、文本数据、视频数据。4.根据权利要求2所述的方法,其特征在于,所述使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记包括:对所述编码方式进行标签化处理,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记,得到标签与所述编码标记的映射关系。5.根据权利要求4所述的方法,其特征在于,将所述特征输入预先构建的识别模型,得到目标文本的编码方式包括:所述预先构建的识别模型根据所述特征得到相匹配的编码标记,根据所述标签与所述编码标记的映射关系获取目标文本的标签,得到目标文本的编码方式。6.一种文本转换装置,其特征在于,所述装置包括:提取模块,用于获取目标文本及待转换的目标编码方式,对所述目标文本进行文本特征提取,得到目标文本的特征;识别模块,用于将所述特征输入预先构建的识别模型,得到目标文本数据的原始编码方式;解码模块,用于根据所述原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本;编码模块,用于根根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。7.根据权利要求6所述的装置,其特征在于,所述预先构建的识别模型的生成方式包括:获取不同类型的文本,使用不同的编码方式对所述文本进行编码,对编码后的文本进行编码标记;对所述文本进行文本特征提取,所述文本特征与所述编码标记相对应;根据所述文本特征与所述编码标记进行训练,得到所述预先构建的识别模型。8.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在
于,所述处理器执行所述计算机程序时实现权利要求1至5中任一项所述的文本转换方法的步骤。9.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至5中任一项所述的文本转换方法的步骤。10.一种计算机程序产品,包括计算机程序,其特征在于,该计算机程序被处理器执行时实现权利要求1至5中任一项所述的文本转换方法的步骤。
技术总结
本申请涉及一种文本转换方法、装置、计算机设备。所述方法包括:获取目标文本及待转换的目标编码方式,对所述目标文本进行文本特征提取,得到目标文本的特征;将所述特征输入预先构建的识别模型,得到所述目标文本的原始编码方式;根据所述原始编码方式对应的解码方式,对目标文本进行解码,得到原始文本;根据目标编码方式对原始文本进行编码,得到所述目标编码方式对应格式下的文本。采用本方法能够提高文本转换的准确率和效率。高文本转换的准确率和效率。高文本转换的准确率和效率。
技术研发人员:吴婷婷
受保护的技术使用者:兴业数字金融服务(上海)股份有限公司
技术研发日:2023.07.14
技术公布日:2023/10/19
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/