一种信息处理方法、装置、计算机存储介质与流程
未命名
09-24
阅读:52
评论:0
1.本技术涉及输入法技术领域,尤其涉及一种信息处理方法、装置、计算机存储介质。
背景技术:
2.在输入低频使用的词语时,我们的一些输入习惯并不能很好的帮助输入法训练词库。如,当我们想输入“殷实”时,如果输入“yinshi”,由于该同音词较多,在输入法候选列表中寻找起来较为困难。因此用户通常会先输入带有该字的、较为易于被候选推荐到的词语,例如“殷勤”,随后删除多余的字,留下“殷”,其次输入“实在”,再次删除多余的字,以此获取最终的“殷实”这个输入结果。另有场景,我们输入一些特定的拼音词语组合,例如“xian”、“tian”、“mian”,输入法无法判断我们是想输入“先/西安”、“天/提案”、“面/密胺”,因此在候选项中寻找也会比较困难,通常用户仍会采用上述词组回删,分字输入的方式,目前亟需一种词语定位的方法帮助用户快速找到其想输入的词语。
技术实现要素:
3.本技术实施例提供了一种信息处理方法、装置、电子设备、芯片及计算机可读存储介质。
4.本技术实施例的技术方案是这样实现的:
5.第一方面,本技术实施例提供了一种信息处理方法,所述方法包括:
6.接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;所述第一句段基于第一部分操作生成,所述第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作;
7.基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象;
8.从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。
9.第二方面,本技术实施例提供了一种信息处理装置,包括:
10.对比单元:用于接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;所述第一句段基于第一部分操作生成,所述第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作;
11.标记单元:用于基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象;
12.生成单元:用于从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。
13.第三方面,本技术提供一种电子设备,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行本技术实施例所提供的任意一种信息处理方法。
14.第四方面,本技术提供一种芯片,包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行本技术实施例所提供的任意一种信息处理方法。
15.第五方面,本技术提供一种计算机可读存储介质,用于存储计算机程序,所述计算机程序使得计算机执行本技术实施例所提供的任意一种信息处理方法。
16.通过本技术实施例所提供的信息处理方法,接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;所述第一句段基于第一部分操作生成,所述第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作;基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象;从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。本技术的技术方案采用标点符号作为操作信号,能够有效的在日常复杂的文档输入环境下提升判断正确性,在非纯文本场景下也能正确应用。
附图说明
17.图1为本技术实施例所提供的信息处理方法示意图一;
18.图2为本技术实施例所提供的信息处理方法示意图二;
19.图3为本技术实施例提供的信息处理装置的结构示意图;
20.图4为本技术实施例提供的一种电子设备示意性结构图;
21.图5为本技术实施例提供的芯片的示意性结构图。
具体实施方式
22.下面将结合本技术实施例中的附图,对本技术实施例中的技术方案进行描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
23.需要说明的是,本技术实施例中,术语“和/或”,仅仅是一种描述关联对象的关联关系,表示可以存在三种关系,例如,a和/或b,可以表示:单独存在a,同时存在a和b,单独存在b这三种情况。另外,本技术实施例中,字符“/”,一般表示前后关联对象是一种“或”的关系。
24.在本技术实施例的描述中,术语“对应”可表示两者之间具有直接对应或间接对应
的关系,也可以表示两者之间具有关联关系,也可以是指示与被指示、配置与被配置等关系。
25.为便于理解本技术实施例的技术方案,以下对本技术实施例的相关技术进行说明,以下相关技术作为可选方案与本技术实施例的技术方案可以进行任意结合,其均属于本技术实施例的保护范围。
26.相关技术中,根据对应于已输入的目标词语的删除操作信号,删除目标词语中的至少一个汉字,得到保留字段;其中,目标词语包括至少两个汉字,保留字段包括至少一个汉字;将保留字段和目标字段拼接,形成合成词;其中,目标字段包括:位于保留字段之前且与保留字段相邻的第一字段,和/或,位于保留字段之后且与保留字段相邻的第二字段;将合成词添加至输入法词库中。该技术方案通过检测删除操作信号,触发后续分析与字符拼接入库,但是该方案不可避免的需要将键盘回退键加入到检测,而实际使用场景通常都非纯文本,尤其是在操作富文本编辑器时,由于其高度支持各种格式,包含图片、视频、附件、链接等形式,均可支持使用键盘回退键删除,此时若触发现有方案的检测与判断机制,很容易产生非用户目标的词语,长期如此导致词库被加入大量杂质。
27.可见,现有方案仅能针对已输入的目标词语的删除操作信号进行反应,无法排除非文本的干扰。
28.针对上述相关技术存在的缺陷,提出了本技术实施例的以下技术方案。
29.为了能够更加详尽地了解本技术的特点与技术内容,下面结合附图对本技术的实现进行详细阐述,所附附图仅供参考说明之用,并非用来限定本技术。
30.图1为本技术实施例提供的一种信息处理方法的实现流程示意图一,如图1所示,本技术实施例提供一种信息处理方法,所述方法包括以下步骤:
31.步骤101:接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;所述第一句段基于第一部分操作生成,所述第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作。
32.这里,第一符号与第二符号可以是标点符号,也可以是其他可以标记句段的符号,比如段落中的特殊格式,在新起段落的第一句,第二符号可以是首行缩进,本技术对此并不做限定。
33.这里,对象可以是单个的字,也可以是由多个字组成的词。
34.本技术一优选实施例所提供的信息处理方法,以标点符号作为标记句段的信号,以标点符号作为分割单位,将此次输入标点符号与上一次输入标点符号之间的第一句段与第二句段进行对比。其中,第一句段为输入句段,第二句段为留存句段,这里,第一句段基于第一部分操作生成,第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作。需要指出的是,输入句段包括留存句段中的所有对象。
35.示意性的,在两次输入的标点符号之间,用户的输入操作过程为:
36.s1:输入以下对象:小王、有着、饮食的;
37.s2:删除以下对象:饮食的;
38.s3:再输入以下对象:殷勤、实际、的、基础;
39.s4:再删除以下对象:勤、际。
40.上述s1和s3对应的操作即为第一部分操作,s2和s4对应的操作即为第二部分操作。通过第一部分操作得到的第一句段(也即输入句段)为:小王有着饮食的殷勤实际的基础。通过第一部分操作和第二部分操作得到的第二句段(也即留存句段)为:小王有着殷实的基础。
41.示意性的,在两次输入的标点符号之间,用户的输入操作过程为:
42.s1:输入以下对象:小王、有着、殷勤、实际、的、基础;
43.s2:删除以下对象:勤、际。
44.上述s1对应的操作即为第一部分操作,s2对应的操作即为第二部分操作。通过第一部分操作得到的第一句段(也即输入句段)为:小王有着殷勤实际的基础。通过第一部分操作和第二部分操作得到的第二句段(也即留存句段)为:小王有着殷实的基础。
45.步骤102:基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象。
46.示意性的,以留存句段“小王有着殷实的基础”为例,将输入句段“小王有着殷勤实际的基础”与留存句段“小王有着殷实的基础”进行对比,得到对比结果,即第二句段相对于所述第一句段被删除的对象为“勤”和“际”。
47.步骤103:从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。
48.本技术另一实施例所提供的信息处理方法,所述从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词,包括:
49.从所述第二句段中查找位于所述被删除的对象之前的第一对象和以及位于所述被删除的对象之后的第二对象;
50.将所述第一对象和所述第二对象进行拼合,得到合成词。
51.以留存句段“有一个迷案”为例,输入句段为“有一个迷惘案”,这样将留存句段与输入句段进行对比后确认“惘”为被删除对象,这样,“迷”和“案”分别为第一对象和第二对象,将第一对象与第二对象拼合后得到合成词“迷案”。
52.可以理解的是,上述例子是在删除对象为一个的情况下所列举的,当删除对象为多个的时候,合成词的数目也是多个。
53.基于此,在本技术另一实施例中,所述被删除的对象的数目为一个的情况下,得到的合成词的数目为一个;
54.所述被删除的对象的数目为多个的情况下,得到的合成词的数目为多个。
55.具体的,以留存句段为“小王有着殷实的基础”为例,将输入句段“小王有着殷勤实际的基础”与留存句段“小王有着殷实的基础”进行对比后得到被删除对象为“勤”和“际”,得到两个合成词“殷实”和“实的”。
56.进一步的,在合成词的数目为一个情况下,将该合成词作为候选词,在合成词的数目为多个情况下,可以预设合并规则来判断多个合成词是否可以合并,将可以合并的合成
词合并成为一个候选词,将不能合并的合成词分别作为候选词。
57.基于此,本技术另一实施例所提供的信息处理方法,所述合成词的数目为一个的情况下,将一个合成词作为一个候选词。
58.本技术又一实施例所提供的信息处理方法,所述合成词的数目为多个的情况下,判断多个合成词是否满足合并条件;
59.若满足,则将所述多个合成词按照合并规则合并为一个候选词;
60.若不满足,则将所述多个合成词分别作为候选词。
61.具体的,示意性的,继续以以留存句段为“小王有着殷实的基础”为例,两个合成词为“殷实”和“实的”,预设的合并规则可以是第一个合成词的最后一个字与第二个合成词的第一个字相同,这样,“殷实”和“实的”满足预设的合并条件,合并为“殷实的”作为候选词。
62.这里,候选词是将要与词库进行比对的词语,可以基于候选词在词库中找到相应的对应词,提高对应词在词库中的推荐权重,以方便下次输入相同拼音时可以推荐使用者想输入的词语。
63.基于此,本技术另一实施例所提供的信息处理方法,还包括:
64.基于所述候选词,得到词库中的对应词;
65.提高所述对应词在所述词库中的推荐权重。
66.本技术又一实施例所提供的信息处理方法,所述基于所述候选词,得到词库中的对应词,包括:
67.将所述候选词与词库中的字数小于等于所述候选词的所有词进行对比;
68.将与所述候选词包含重合和/或完全重合的至少一个词作为所述对应词。
69.具体的,以留存句段为“小王有着殷实的基础”为例,得到候选词为“殷实的”,“殷实的”共3个字,将词库中的字数小于等于3的所有词与“殷实的”进行对比,将与“殷实的”包含重合和/或完全重合的至少一个词作为所述对应词。
70.这里,包含重合指的是词库中词语字数小于候选词并被候选词中包含的词语,比如“殷实的”与词库中的“殷实”包含重合,完全重合是指词库中词语与候选词完全重合的词语,比如“殷实的”与词库中的“殷实的”完全重合。
71.前述步骤中将被删除对象的前后一个字进行拼合得到合成词,候选词用户实际想要的词相比,往往是多了一个字的,在该实施例中,通过将候选词与词库中小于等于候选词字数的所有词进行对比,筛选出包含重合和/或完全重合的词,可以排除多出的字的干扰,以“殷实的”为例,词库中往往没有“实的”,只增加“殷实的”与“殷实”的推荐权重。
72.本技术另一实施例所提供的信息处理方法,所述对象包括一个字或者多个字。
73.具体的,示意性的,当用户通过输入一个四字成语得到目标词的情况下,用户可能是删除前两个字保留后两个字,也可能是删除后两个字保留前两个字。
74.图2为本技术实施例提供的一种信息处理方法的实现流程示意图二,如图2所示,本技术实施例提供一种信息处理方法,包括以下步骤:
75.步骤201:判断用户是否输入标点。
76.这里,使用标点符号作为识别触发信号,将两个标点符号之间的句子作为识别的句段。
77.步骤202:将输入句段与留存句段进行对比。
78.具体的,将输入句段与留存句段进行对比后获得被删除的字。
79.步骤203:使用删除字前后的字拼合为合成词。
80.这里,可以将被删除字的前后的各一个字进行拼合得到合成词。
81.步骤204:对比词库,找到词库中的对应词。
82.进一步的,将合成词与词库中字数小于合成词的所有词语对比,将包含重合和/或完全重合的词语作为对应词。
83.步骤205:调整词库中对应词的推荐权重。
84.本技术实施例所提供的信息处理方法,采用标点输入作为操作信号,代替删除作为输入信号,能够有效的在日常复杂的文档输入环境下提升判断正确性,在非纯文本场景下也能正确应用。
85.另外,目前市场上的输入法,词库均较为完善,用户面临的并不是词库中没有该词语的问题,而是词语过多难以定位的问题,所以本提案使用了候选词与词库对比的方法,提升词库对应词的权重,而非一味的添加词语入库,不会为词库增加大量难以验证的杂质词语,提升用户的输入体验。
86.本技术实施例还提供了信息处理装置300;图3为本技术实施例提供的信息处理装置300的结构示意图,如图3所示,本技术实施例提供的信息处理装置300,包括:
87.对比单元301:用于接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;所述第一句段基于第一部分操作生成,所述第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作。
88.标记单元302:用于基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象。
89.生成单元303:用于从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。
90.在本技术其他实施例中,生成单元303:具体用于从所述第二句段中查找位于所述被删除的对象之前的第一对象和以及位于所述被删除的对象之后的第二对象;将所述第一对象和所述第二对象进行拼合,得到合成词。
91.在本技术其他实施例中,所述被删除的对象的数目为一个的情况下,得到的合成词的数目为一个;所述被删除的对象的数目为多个的情况下,得到的合成词的数目为多个。
92.在本技术其他实施例中,所述生成单元303:还用于所述合成词的数目为一个的情况下,将一个合成词作为一个候选词。
93.在本技术其他实施例中,所述生成单元303;还用于在所述合成词的数目为多个的情况下,判断多个合成词是否满足合并条件;若满足,则将所述多个合成词按照合并规则合并为一个候选词;若不满足,则将所述多个合成词分别作为候选词。
94.在本技术其他实施例中,所述信息处理装置还包括调整单元304:用于基于所述候选词,得到词库中的对应词;提高所述对应词在所述词库中的推荐权重。
95.在本技术其他实施例中,所述调整单元304:具体用于将所述候选词与词库中的字
数小于等于所述候选词的所有词进行对比;将与所述候选词包含重合和/或完全重合的至少一个词作为所述对应词。
96.在本技术其他实施例中,所述对象包括一个字或者多个连续的字。
97.本领域技术人员应当理解,图3所示的信息处理装置中的各单元的实现功能可参照前述方法的相关描述而理解。图3所示的信息处理装置中的各单元的功能可通过运行于处理器上的程序而实现,也可通过具体的逻辑电路而实现。
98.图4是本技术实施例提供的一种电子设备400示意性结构图。图4所示的电子设备400包括处理器410,处理器410可以从存储器中调用并运行计算机程序,以实现本技术实施例中的方法。
99.可选地,如图4所示,电子设备400还可以包括存储器420。其中,处理器410可以从存储器420中调用并运行计算机程序,以实现本技术实施例中的方法。
100.其中,存储器420可以是独立于处理器410的一个单独的器件,也可以集成在处理器410中。
101.可选地,如图4所示,电子设备400还可以包括收发器430,处理器410可以控制该收发器430与其他设备进行通信,具体地,可以向其他设备发送信息或数据,或接收其他设备发送的信息或数据。
102.其中,收发器430可以包括发射机和接收机。收发器430还可以进一步包括天线,天线的数量可以为一个或多个。
103.该电子设备400具体可为本技术实施例的信息处理装置,并且该电子设备400可以实现本技术实施例的各个方法中由信息处理装置实现的相应流程,为了简洁,在此不再赘述。
104.图5是本技术实施例的芯片的示意性结构图。图5所示的芯片500包括处理器510,处理器510可以从存储器中调用并运行计算机程序,以实现本技术实施例中的方法。
105.可选地,如图5所示,芯片500还可以包括存储器520。其中,处理器510可以从存储器520中调用并运行计算机程序,以实现本技术实施例中的方法。
106.其中,存储器520可以是独立于处理器510的一个单独的器件,也可以集成在处理器510中。
107.可选地,该芯片500还可以包括输入接口530。其中,处理器510可以控制该输入接口530与其他设备或芯片进行通信,具体地,可以获取其他设备或芯片发送的信息或数据。
108.可选地,该芯片500还可以包括输出接口540。其中,处理器510可以控制该输出接口540与其他设备或芯片进行通信,具体地,可以向其他设备或芯片输出信息或数据。
109.该芯片可应用于本技术实施例中的信息处理装置,并且该芯片可以实现本技术实施例的各个方法中由信息处理装置实现的相应流程,为了简洁,在此不再赘述。
110.应理解,本技术实施例提到的芯片还可以称为系统级芯片,系统芯片,芯片系统或片上系统芯片等。
111.应理解,本技术实施例的处理器可能是一种集成电路芯片,具有信号的处理能力。在实现过程中,上述方法实施例的各步骤可以通过处理器中的硬件的集成逻辑电路或者软件形式的指令完成。上述的处理器可以是通用处理器、数字信号处理器(digital signal processor,dsp)、专用集成电路(application specific integrated circuit,asic)、现
成可编程门阵列(field programmable gate array,fpga)或者其他可编程逻辑器件、分立门或者晶体管逻辑器件、分立硬件组件。可以实现或者执行本技术实施例中的公开的各方法、步骤及逻辑框图。通用处理器可以是微处理器或者该处理器也可以是任何常规的处理器等。结合本技术实施例所公开的方法的步骤可以直接体现为硬件译码处理器执行完成,或者用译码处理器中的硬件及软件模块组合执行完成。软件模块可以位于随机存储器,闪存、只读存储器,可编程只读存储器或者电可擦写可编程存储器、寄存器等本领域成熟的存储介质中。该存储介质位于存储器,处理器读取存储器中的信息,结合其硬件完成上述方法的步骤。
112.可以理解,本技术实施例中的存储器可以是易失性存储器或非易失性存储器,或可包括易失性和非易失性存储器两者。其中,非易失性存储器可以是只读存储器(read-only memory,rom)、可编程只读存储器(programmable rom,prom)、可擦除可编程只读存储器(erasable prom,eprom)、电可擦除可编程只读存储器(electrically eprom,eeprom)或闪存。易失性存储器可以是随机存取存储器(random access memory,ram),其用作外部高速缓存。通过示例性但不是限制性说明,许多形式的ram可用,例如静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synchlink dram,sldram)和直接内存总线随机存取存储器(direct rambus ram,dr ram)。应注意,本文描述的系统和方法的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
113.应理解,上述存储器为示例性但不是限制性说明,例如,本技术实施例中的存储器还可以是静态随机存取存储器(static ram,sram)、动态随机存取存储器(dynamic ram,dram)、同步动态随机存取存储器(synchronous dram,sdram)、双倍数据速率同步动态随机存取存储器(double data rate sdram,ddr sdram)、增强型同步动态随机存取存储器(enhanced sdram,esdram)、同步连接动态随机存取存储器(synch link dram,sldram)以及直接内存总线随机存取存储器(direct rambus ram,dr ram)等等。也就是说,本技术实施例中的存储器旨在包括但不限于这些和任意其它适合类型的存储器。
114.本技术实施例还提供了一种计算机可读存储介质,用于存储计算机程序。该计算机可读存储介质可应用于本技术实施例中的信息处理装置,并且该计算机程序使得计算机执行本技术实施例的各个方法中由信息处理装置实现的相应流程,为了简洁,在此不再赘述。
115.本技术实施例还提供了一种计算机程序产品,包括计算机程序指令。该计算机程序产品可应用于本技术实施例中的信息处理装置,并且该计算机程序指令使得计算机执行本技术实施例的各个方法中由信息处理装置实现的相应流程,为了简洁,在此不再赘述。
116.本技术实施例还提供了一种计算机程序。该计算机程序可应用于本技术实施例中的信息处理装置,当该计算机程序在计算机上运行时,使得计算机执行本技术实施例的各个方法中由信息处理装置实现的相应流程,为了简洁,在此不再赘述。
117.本领域普通技术人员可以意识到,结合本文中所公开的实施例描述的各示例的单元及算法步骤,能够以电子硬件、或者计算机软件和电子硬件的结合来实现。这些功能究竟
以硬件还是软件方式来执行,取决于技术方案的特定应用和设计约束条件。专业技术人员可以对每个特定的应用来使用不同方法来实现所描述的功能,但是这种实现不应认为超出本技术的范围。
118.所属领域的技术人员可以清楚地了解到,为描述的方便和简洁,上述描述的系统、装置和单元的具体工作过程,可以参考前述方法实施例中的对应过程,在此不再赘述。
119.在本技术所提供的几个实施例中,应该理解到,所揭露的系统、装置和方法,可以通过其它的方式实现。例如,以上所描述的装置实施例仅仅是示意性的,例如,所述单元的划分,仅仅为一种逻辑功能划分,实际实现时可以有另外的划分方式,例如多个单元或组件可以结合或者可以集成到另一个系统,或一些特征可以忽略,或不执行。另一点,所显示或讨论的相互之间的耦合或直接耦合或通信连接可以是通过一些接口,装置或单元的间接耦合或通信连接,可以是电性,机械或其它的形式。
120.所述作为分离部件说明的单元可以是或者也可以不是物理上分开的,作为单元显示的部件可以是或者也可以不是物理单元,即可以位于一个地方,或者也可以分布到多个网络单元上。可以根据实际的需要选择其中的部分或者全部单元来实现本实施例方案的目的。
121.另外,在本技术各个实施例中的各功能单元可以集成在一个处理单元中,也可以是各个单元单独物理存在,也可以两个或两个以上单元集成在一个单元中。
122.所述功能如果以软件功能单元的形式实现并作为独立的产品销售或使用时,可以存储在一个计算机可读取存储介质中。基于这样的理解,本技术的技术方案本质上或者说对现有技术做出贡献的部分或者该技术方案的部分可以以软件产品的形式体现出来,该计算机软件产品存储在一个存储介质中,包括若干指令用以使得一台计算机设备(可以是个人计算机,服务器,或者网络设备等)执行本技术各个实施例所述方法的全部或部分步骤。而前述的存储介质包括:u盘、移动硬盘、只读存储器(read-only memory,)rom、随机存取存储器(random access memory,ram)、磁碟或者光盘等各种可以存储程序代码的介质。
123.以上所述,仅为本技术的具体实施方式,但本技术的保护范围并不局限于此,任何熟悉本技术领域的技术人员在本技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本技术的保护范围之内。因此,本技术的保护范围应所述以权利要求的保护范围为准。
技术特征:
1.一种信息处理方法,其特征在于,所述方法包括:接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;所述第一句段基于第一部分操作生成,所述第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作;基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象;从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。2.根据权利要求1所述的方法,其特征在于,所述从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词,包括:从所述第二句段中查找位于所述被删除的对象之前的第一对象和以及位于所述被删除的对象之后的第二对象;将所述第一对象和所述第二对象进行拼合,得到合成词。3.根据权利要求2所述的方法,其特征在于,所述被删除的对象的数目为一个的情况下,得到的合成词的数目为一个;所述被删除的对象的数目为多个的情况下,得到的合成词的数目为多个。4.根据权利要求3所述的方法,其特征在于,还包括:所述合成词的数目为一个的情况下,将一个合成词作为一个候选词。5.根据权利要求3所述的方法,其特征在于,还包括:所述合成词的数目为多个的情况下,判断多个合成词是否满足合并条件;若满足,则将所述多个合成词按照合并规则合并为一个候选词;若不满足,则将所述多个合成词分别作为候选词。6.根据权利要求4或5所述的方法,其特征在于,还包括:基于所述候选词,得到词库中的对应词;提高所述对应词在所述词库中的推荐权重。7.根据权利要求6所述的方法,其特征在于,所述基于所述候选词,得到词库中的对应词,包括:将所述候选词与词库中的字数小于等于所述候选词的所有词进行对比;将与所述候选词包含重合和/或完全重合的至少一个词作为所述对应词。8.根据权利要求1至5中任一项所述的方法,其特征在于,所述对象包括一个字或者多个连续的字。9.一种信息处理装置,其特征在于,包括:对比单元:用于接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;所述第一句段基于第一部分操作生成,所述第二句段基于所述第一部分操作和第二部分操作生成,所述第一部分操作用于输入m个对象,所述第二部分操作用于删除所述m个对象中的n个
对象,n和m为正整数且n小于m;所述第一部分操作和所述第二部分操作是位于所述第一符号的输入操作和所述第二符号的输入操作之间的操作;标记单元:用于基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象;生成单元:用于从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。10.一种电子设备,其特征在于,包括:处理器和存储器,该存储器用于存储计算机程序,所述处理器用于调用并运行所述存储器中存储的计算机程序,执行如权利要求1至8中任一项所述的信息处理方法。11.一种芯片,其特征在于,包括:处理器,用于从存储器中调用并运行计算机程序,使得安装有所述芯片的设备执行如权利要求1至8中任一项所述的信息处理方法。12.一种计算机可读存储介质,其特征在于,用于存储计算机程序,所述计算机程序使得计算机执行如权利要求1至8中任一项所述的信息处理方法。
技术总结
本申请实施例公开了一种信息处理方法、装置、计算机存储介质,所述方法包括:接收到针对第一符号的输入操作后,将所述第一符号与第二符号之间的第一句段与第二句段进行对比;所述第二符号为所述第一符号之前的一个符号;基于所述第一句段与所述第二句段的对比结果,标记所述第二句段相对于所述第一句段被删除的对象;从所述第二句段中确定出与所述被删除的对象相关联的对象,基于所述相关联的对象生成合成词。本申请采用标点输入作为操作信号,代替删除作为输入信号,能够有效的在日常复杂的文档输入环境下提升判断正确性,在非纯文本场景下也能正确应用。下也能正确应用。下也能正确应用。
技术研发人员:石云柯 梁丹 周慧玲
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2022.06.28
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/