敲击行为识别方法、装置、芯片和耳机与流程

未命名 10-26 阅读:83 评论:0


1.本发明涉及可穿戴设备数据交互处理领域,具体涉及一种敲击行为识别方法、装置、芯片和耳机。


背景技术:

2.随着技术的发展,可穿戴设备具有越来越丰富的交互接口,比如按键、触摸和敲击等等。比如无线耳机,随着美观、实用性的关注,越来越多的敲击交互功能引入到产品中。
3.通常来说,音频设备设置有物理按键,用户可以通过物理按键对音频设备进行控制,以实现网络连接、音量调节、重启等多种功能。物理按键一般采用两种方式,一种是按键开关式,使用时,用户通过机械按压方式实现对音频设备的控制;另一种是电容触摸式,使用时,其用户通过触摸方式实现对音频设备的控制。一般而言,敲击行为被传感器转换为数字信号之后,进行一系列算法的处理后,识别为有限状态下的事件,比如双击、三击。可穿戴设备识别动作之后,执行对应的动作,比如暂停播放、下一曲等。
4.现有的可穿戴产品中,大多使用专用的传感器,比如加速度传感器、触摸传感器等来识别敲击。同时,需要通过多传感器联合识别以减少环境对敲击识别的影响,比如在单个设备中,同时配置触摸传感器和加速度传感器,减少环境对误触发的影响。添加额外的传感器(比如加速度传感器)来识别敲击行为,导致付出额外的成本,成本较大。
5.因此,如何减少额外的硬件成本来识别有效的敲击行为,成为亟待解决的技术问题。


技术实现要素:

6.基于上述现状,本发明的主要目的在于提供一种敲击行为识别方法、装置、芯片和耳机,以减少额外的硬件成本来识别有效的敲击行为。
7.为实现上述目的,本发明采用的技术方案如下:
8.第一方面,本发明实施例公开了一种敲击行为识别方法,应用于具有麦克风采集音频功能的耳机,方法包括:
9.步骤s100,在预设时长内获取麦克风采集的音频信号,音频信号包含敲击信号;
10.步骤s200,提取音频信号的音频特征,音频特征包括相似度、梯度和峰均比之一或任意组合;
11.步骤s300,依据音频特征在预设时长内区分敲击信号和抖动信号,以提取音频信号中的敲击信号得到敲击信号序列,其中,抖动信号包含在音频信号中;
12.步骤s400,依据敲击信号序列按预设的对应关系确定敲击信号序列对应的用户的控制操作。
13.可选地,耳机为主动降噪耳机,耳机包含参考麦克风和误差麦克风;
14.在步骤s100中,获取通过误差麦克风采集的音频信号。
15.可选地,步骤s100包括:对误差麦克风采集的信号进行预设倍数的下采样处理后
得到音频信号。
16.可选地,在步骤s300中,被识别为敲击信号的信号特征为相邻时段的波形相似度超过第一阈值,该信号与相邻采样点的信号的幅值梯度差超过第二阈值,且在预设时段内该信号对应的峰均比超过第三阈值。
17.可选地,在步骤s300中,被识别为抖动信号的信号特征为相邻时段的波形相似度小于第一阈值,该信号与相邻采样点的信号的幅值梯度超过第二阈值,且在预设时段内该信号对应的峰均比小于第三阈值。
18.可选地,在识别到存在抖动信号后,提高第一阈值、第二阈值和第三阈值,以自适应更新检测阈值。
19.可选地,所述耳机包含成对的第一耳机和第二耳机,当第一耳机的脉冲最大值相对于第二耳机的脉冲最大值超过第四阈值时,确定在所述第一耳机上发生了敲击行为,并识别所述第一耳机的敲击信号。
20.第二方面,本发明实施例公开了一种敲击行为识别装置,应用于具有麦克风采集音频功能的耳机,装置包括:
21.音频信号获取模块,用于在预设时长内获取麦克风采集的音频信号,音频信号包含敲击信号;
22.特征提取模块,用于提取音频信号的音频特征,音频特征包括相似度、梯度和峰均比之一或任意组合;
23.敲击信号区分模块,用于依据音频特征在预设时长内区分敲击信号和抖动信号,以提取音频信号中的敲击信号得到敲击信号序列,其中,抖动信号包含在音频信号中;
24.操作对应模块,用于依据敲击信号序列按预设的对应关系确定敲击信号序列对应的用户的控制操作。
25.可选地,耳机为主动降噪耳机,耳机包含参考麦克风和误差麦克风;
26.在音频信号获取模块中,获取通过误差麦克风采集的音频信号。
27.可选地,音频信号获取模块包括:对误差麦克风采集的信号进行预设倍数的下采样处理后得到音频信号。
28.可选地,在敲击信号区分模块中,被识别为敲击信号的信号特征为相邻时段的波形相似度超过第一阈值,该信号与相邻采样点的信号的幅值梯度差超过第二阈值,且在预设时段内该信号对应的峰均比超过第三阈值。
29.可选地,在敲击信号区分模块中,被识别为抖动信号的信号特征为相邻时段的波形相似度小于第一阈值,该信号与相邻采样点的信号的幅值梯度超过第二阈值,且在预设时段内该信号对应的峰均比小于第三阈值。
30.可选地,在识别到存在抖动信号后,提高第一阈值、第二阈值和第三阈值,以自适应更新检测阈值。
31.可选地,所述耳机包含成对的第一耳机和第二耳机,当第一耳机的脉冲最大值相对于第二耳机的脉冲最大值超过第四阈值时,确定在所述第一耳机上发生了敲击行为,并识别所述第一耳机的敲击信号。
32.第三方面,本发明实施例公开了一种耳机,具有麦克风采集音频功能,包括:
33.处理器,用于实现上述第一方面公开的方法。
34.第四方面,本发明实施例公开了一种计算机可读存储介质,其上存储有计算机程序,存储介质中存储的计算机程序用于被处理器执行实现上述第一方面公开的方法。
35.第五方面,本发明实施例公开了一种音频处理芯片,其上具有集成电路,集成电路被配置为实现上述第一方面公开的方法。
36.依据本发明实施例公开的一种敲击行为识别方法、装置和耳机,在预设时长内获取麦克风采集的音频信号,提取音频信号的音频特征,音频特征包括相似度、梯度和峰均比之一或任意组合,由此可以区分敲击信号和抖动信号,从而能够提取音频信号中的敲击信号得到敲击信号序列,基于此按预设的对应关系确定敲击信号序列对应的用户的控制操作。相对于传统方案通过振动传感器检测敲击信号,本发明实施例以耳机原本自带的麦克风作为敲击传感器识别敲击,减少了使用专用振动传感器的使用成本,也就是减少了额外的硬件成本,具有可行性高、经济、有效的特点。
37.本发明的其他有益效果,将在具体实施方式中通过具体技术特征和技术方案的介绍来阐述,本领域技术人员通过这些技术特征和技术方案的介绍,应能理解所述技术特征和技术方案带来的有益技术效果。
附图说明
38.以下将参照附图对本发明实施例进行描述。图中:
39.图1为本实施例公开的一种敲击行为识别方法流程图;
40.图2为本实施例公开的一种主动降噪耳机示意图;
41.图3为本实施例公开的一种有效的敲击信号波形示意图;
42.图4为本实施例公开的一种抖动信号引起的波形示意图;
43.图5为本实施例公开的一种敲击行为识别装置结构示意图;
44.图6为本实施例公开的一种耳机音频处理芯片原理示意框图。
具体实施方式
45.以下基于实施例对本发明进行描述,但是本发明并不仅仅限于这些实施例。在下文对本发明的细节描述中,详尽描述了一些特定的细节部分,为了避免混淆本发明的实质,公知的方法、过程、流程、元件并没有详细叙述。
46.此外,本领域普通技术人员应当理解,在此提供的附图都是为了说明的目的,并且附图不一定是按比例绘制的。
47.除非上下文明确要求,否则整个说明书和权利要求书中的“包括”、“包含”等类似词语应当解释为包含的含义而不是排他或穷举的含义;也就是说,是“包括但不限于”的含义。
48.在本发明的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。此外,在本发明的描述中,除非另有说明,“多个”的含义是两个或两个以上。
49.为了减少额外的硬件成本来识别有效的敲击行为,本实施例公开了一种敲击行为识别方法,应用于具有麦克风采集音频功能的耳机,请参考图1,图1为本实施例公开的一种敲击行为识别方法流程图,该敲击行为识别方法包括:步骤s100、步骤s200、步骤s300和步
骤s400,其中:
50.步骤s100,在预设时长内获取麦克风采集的音频信号。本实施例中,音频信号包含敲击信号。现有的可穿戴设备中,大多配置麦克风,所以不需要额外增加硬件配置,减少了硬件成本。具体地,通过耳机自带的麦克风来采集音频信号,当用户敲击耳机时,通常会发出敲击声,因此可以通过麦克风来采集敲击声,由此来确定用户的敲击行为。
51.在可选的实施例中,耳机为主动降噪耳机,请参考图2,图2为本实施例公开的一种主动降噪耳机示意图,耳机包含耳机腔体、处理器和麦克风,其中麦克风包含参考麦克风ff和误差麦克风fb,其中,参考麦克风ff用于采集外部噪声,误差麦克风fb用于采集耳道噪声。在优选的实施例中,在步骤s100中,获取通过误差麦克风采集的音频信号。本实施例中,相对于参考麦克风ff,优先选择误差麦克风fb作为敲击的检测传感器,误差麦克风fb置于封闭腔体内,具有放大低频的特性,更能有效的识别到敲击动作产生的脉冲。
52.步骤s200,提取音频信号的音频特征,音频特征包括相似度、梯度和峰均比之一或任意组合。具体地,通过音频特征的分析,可以将有效的敲击声与噪音(例如抖动声)进行区分。请参考图3和图4,其中,图3为本实施例公开的一种有效的敲击信号波形示意图,图4为本实施例公开的一种抖动信号引起的波形示意图,图3和图4中,横坐标为采样点序号,纵坐标为采样点对应的信号量化值,通过对比图3和图4的波形图可知:有效敲击信号在相邻的不同预设时段内的波形存在相似,本实施例中,通过相似度来表征,也就是,相似度是指延时信号(在一定的预设时间段内)的相似度,即,前后两个脉冲前后的波形的相似度;当有敲击信号时,其波形会发生一定幅度的变化,本实施中,通过梯度来识别脉冲,即相邻信号(预设时长相邻采样点)的幅度差,例如,在t2采样点的幅值与t1采样点的幅值存在幅度差,则有可能被认为是脉冲信号;峰均比par是指在一个时间段内,取最大值与平均值做比值。在具体实施例中,通过对波形的量化分析,可以提取音频信号的音频特征,继而可以通过相似度、梯度和峰均比之一或任意组合来识别到敲击信号。
53.步骤s300,依据音频特征在预设时长内区分敲击信号和抖动信号,以提取音频信号中的敲击信号得到敲击信号序列,其中,抖动信号包含在音频信号中。本实施例中,所称敲击信号序列是指例如双击、三击等敲击行为,当然每个敲击之间还可以有时间间隔,以实现长按、短按的区分,在具体实施过程中,可以根据用户的喜好来自行设置敲击信号序列与控制操作的对应关系。需要说明的是,当设置了单击的敲击行为,那么,该敲击信号序列可以包含只有一次敲击的情形。在具体实施例中,由于人的走路、说话、晃动的动作,导致麦克风采集到类似敲击的信号的数据为如图4所示,因此需要有算法来识别这些抖动信号并加以分类处理,由此来区分敲击信号和抖动信号。具体地,可以通过相似度、梯度和峰均比之一或任意组合来识别到敲击信号,或者通过相似度、梯度和峰均比之一或任意组合来识别到抖动信号,在具体实施过程中,可以对不同的音频特征分别设置不同的阈值来识别敲击信号或抖动信号,或者通过高级算法(例如神经网络)来识别敲击信号或抖动信号。在优选的实施例中,通过相似度、梯度和峰均比三者的组合来识别到敲击信号或抖动信号,从而提高识别的准确率和精准度。
54.步骤s400,依据敲击信号序列按预设的对应关系确定敲击信号序列对应的用户的控制操作。在具体实施过程中,可以根据用户的喜好来自行设置敲击信号序列与控制操作的对应关系。需要说明的是,当设置了单击的敲击行为,那么,该敲击信号序列可以包含只
有一次敲击的情形。
55.经研究发现,相对于抖动信号,敲击的信号为低频信号,比如敲击的信号主要能量集中在50hz以下。为了更好地采集敲击信号,弱化干扰信号,在可选的实施例中,步骤s100包括:对误差麦克风采集的信号进行预设倍数的下采样处理后得到音频信号。具体地,常用的麦克风采样率为8k~256k,低采样率(8~16k)用于通话,高采样率(64k~256k)用于减少主动降噪耳机的通路延时,而敲击的信号主要能量集中在50hz以下。为了提高抗干扰能力和减少敲击信号处理的运算量,可以将采样率降低到100hz左右,根据选择的采样率,下采样倍数可选80~2560范围。
56.为了区分敲击信号和抖动信号,在一种实施例中,在步骤s300中,被识别为敲击信号的信号特征为相邻时段的波形相似度超过第一阈值,该信号与相邻采样点的信号的幅值梯度差超过第二阈值,且在预设时段内该信号对应的峰均比超过第三阈值。在另一种实施例中,在步骤s300中,被识别为抖动信号的信号特征为相邻时段的波形相似度小于第一阈值,该信号与相邻采样点的信号的幅值梯度超过第二阈值,且在预设时段内该信号对应的峰均比小于第三阈值。具体地,可以采用特征分析来识别敲击信号或抖动信号,具体如下:
57.在具体实施过程中,特征分析包括对敲击脉冲信号和抖动信号的特征提取和分析,其中,抖动信号是指非有意敲击的脉冲信号。对脉冲信号的识别包括相似度匹配、梯度等方式;对抖动的特征可选峰均比等指标进行分析。
58.由于脉冲响应与耳道结构和敲击力度有关,从而在佩戴者进行敲击无线耳机时,敲击的脉冲连续信号具有一定的相关性(脉冲相似度匹配)。因此,可以使用自相关系数检测脉冲的存在,即:
[0059][0060]
其中,rk是相似度,xi为第i个采样点的麦克风数据,为数据的平均值。k为间隔的点数,根据测试的数据适当的时间间隔为200ms左右。
[0061]
根据如图3和图4敲击信号曲线,可以发现脉冲具有陡峭的峰值,因此,可以使用差分(梯度)来提取脉冲,即:
[0062]gk
=abs(x
i-x
i+k
)
[0063]
该式的物理含义为相邻k个点的梯度gk,通过检测梯度gk值的大小,同样可以识别到脉冲信号。
[0064]
通过采集信号的峰均比par,可以筛选掉抖动信号,以减少误触发无线耳机的控制指令,具体地,峰均比par可以采用如下公式计算:
[0065][0066]
该式的物理含义为在一个时间段内,取最大值与平均值做比值,其中,x
peak
为一个时间段内的最大值,x
average
为一个时间段内的平均值。
[0067]
为了根据环境自适应调整敲击检测阈值,在可选的实施例中,在识别到存在抖动信号后,提高第一阈值、第二阈值和第三阈值,以自适应更新检测阈值。具体地,根据脉冲信号的峰均比等方式识别到抖动之后,可以通过提高预设敲击检测阈值,或者关闭敲击识别
的方式减少误触发,保证使用单麦克风的形式也能有效区分抖动信号和敲击信号。本实施例中,在识别到存在抖动信号之后,将第一阈值、第二阈值和第三阈值提高,抖动的信号不容易产生误触发,同时,真正的敲击信号能够被识别到;当然,当识别到没有抖动的时候,阈值第一阈值、第二阈值和第三阈值可以逐渐降下来,由此来根据环境自适应调整敲击检测阈值。
[0068]
在具体实施过程中,当处于嘈杂的环境,但是没有识别到抖动信号时,敲击检测阈值根据采集到的幅度成正比;
[0069]
当识别到抖动信号时,将敲击检测阈值提高的抖动峰值相关的量,例如:调整后的敲击检测阈值=0.8*峰值,从而减少误触发。
[0070]
在步骤s300中,以敲击信号序列为双击、三击为例:
[0071]
根据预设阈值和特征,判断是否识别到双击
[0072]
根据音频特征(相似度、梯度等)与各自预设的检测阈值对比,判断是否存在双击。当特征超过预设阈值时,判断为存在双击,当特征不超过预设阈值时,判断为不存在双击。
[0073]
根据预设阈值和特征,判断是否识别到三击:
[0074]
根据音频特征(相似度、梯度等)分别与各自预设的检测阈值对比,判断是否存在三击。当特征超过预设阈值时,判断为存在三击,当特征不超过预设阈值时,判断为不存在三击。由于三击出现在双击之后,只有识别存在双击且不存在三击时,才能确定双击的存在。当有双击且有三击时,则不为双击。
[0075]
根据预设阈值和特征,判断是否识别到四击及以上(无效动作):
[0076]
由于常用的敲击命令为双击和三击。因此超过三击的敲击要分类到无效的动作。比如误触发或者无意的敲打可能触发四击动作。也就是,有三击且无四击动作,才视为识别为三击敲击。当然如果用户定义了四击的敲击序列,那么,由于四击出现在三击之后,只有识别存在三击且不存在四击时,才能确定三击的存在;当有三击且有四击时,则不为三击;有四击且无五击动作,才视为识别为四击敲击,以此类推。也就是,当用户设置了n击,则要判断是否有n+1击,有n击且无n+1击动作,才视为识别为n击敲击。
[0077]
为了更精准地确定敲击行为,可以通过两个耳机脉冲信号的对比来确定敲击行为是否发生,在可选的实施例中,耳机包含成对的第一耳机和第二耳机,例如可以是左右耳机对,当第一耳机的脉冲最大值相对于第二耳机的脉冲最大值超过第四阈值时,确定在第一耳机上发生了敲击行为,并识别第一耳机的敲击信号,具体识别方式可以参见上述实施例。也就是,将第一耳机的脉冲最大值与第二耳机的脉冲最大值进行求差或求比的方式可以得到一个差值或比值,而当干扰信号存在时,通过差值或比值可以抵消干扰信号的信号值,于是当差值或比值大于第四阈值时,便可以确定在第一耳机上发生了敲击行为。本实施例中,通过对第一耳机和第二耳机脉冲信号的对比检测,可以平衡检测的信号,共同实现防抖动的误识别,当峰均比更大的才会是敲击信号,从而消除了干扰信号所带来的干扰。
[0078]
本实施例还公开了一种敲击行为识别装置,应用于具有麦克风采集音频功能的耳机,请参考图5,图5为本实施例公开的一种敲击行为识别装置结构示意图,该装置包括:音频信号获取模块100、特征提取模块200、敲击信号区分模块300和操作对应模块400,其中:
[0079]
音频信号获取模块100用于在预设时长内获取麦克风采集的音频信号,音频信号包含敲击信号;
[0080]
特征提取模块200用于提取音频信号的音频特征,音频特征包括相似度、梯度和峰均比之一或任意组合;
[0081]
敲击信号区分模块300用于依据音频特征在预设时长内区分敲击信号和抖动信号,以提取音频信号中的敲击信号得到敲击信号序列,其中,抖动信号包含在音频信号中;
[0082]
操作对应模块400用于依据敲击信号序列按预设的对应关系确定敲击信号序列对应的用户的控制操作。
[0083]
在可选的实施例中,耳机为主动降噪耳机,耳机包含参考麦克风和误差麦克风;
[0084]
在音频信号获取模块100中,获取通过误差麦克风采集的音频信号。
[0085]
在可选的实施例中,音频信号获取模块100包括:对误差麦克风采集的信号进行预设倍数的下采样处理后得到音频信号。
[0086]
在可选的实施例中,在敲击信号区分模块300中,被识别为敲击信号的信号特征为相邻时段的波形相似度超过第一阈值,该信号与相邻采样点的信号的幅值梯度差超过第二阈值,且在预设时段内该信号对应的峰均比超过第三阈值。
[0087]
在可选的实施例中,在敲击信号区分模块300中,被识别为抖动信号的信号特征为相邻时段的波形相似度小于第一阈值,该信号与相邻采样点的信号的幅值梯度超过第二阈值,且在预设时段内该信号对应的峰均比小于第三阈值。
[0088]
在可选的实施例中,在识别到存在抖动信号后,提高第一阈值、第二阈值和第三阈值,以自适应更新检测阈值。
[0089]
在可选的实施例中,耳机包含成对的第一耳机和第二耳机,当第一耳机的脉冲最大值相对于第二耳机的脉冲最大值超过第四阈值时,确定在第一耳机上发生了敲击行为,并识别第一耳机的敲击信号。
[0090]
本实施例还公开了一种耳机,具有麦克风采集音频功能,包括:处理器,用于实现上述实施例公开的方法。
[0091]
本实施例还公开了一种计算机可读存储介质,其上存储有计算机程序,存储介质中存储的计算机程序用于被处理器执行实现上述实施例公开的方法。
[0092]
本实施例还公开了一种音频处理芯片,其上具有集成电路,集成电路被配置为实现上述实施例公开的方法。请参考图6,图6为本实施例公开的一种耳机音频处理芯片原理示意框图,该音频处理芯片包括:
[0093]
adc模块(音频采集模块),用于将麦克风采集的敲击信号进行ad转换,转换为数字信号,在采集敲击信号时可能会采集到抖动信号;
[0094]
下采样模块,将包含有敲击信号的数字信号进行下采样处理,转换到低采样率,减少运算量;
[0095]
特征提取模块,将低采样率信号进行音频特征提取,包括敲击脉冲的提取、抖动特征的提取,具体参见上述实施例的描述,在此不再赘述;
[0096]
脉冲信号比较模块,计算双击、三击脉冲的相似度、梯度、峰均比等指标;
[0097]
敲击阈值判决模块,判决为双击、三击等的敲击行为,以及无效敲击等行为;
[0098]
敲击阈值更新模块,根据抖动峰值和采集的信号幅度更新敲击阈值。
[0099]
需要说明是,在具体实施过程中,可以根据需要在芯片中集成上述模块,也可以集成部分模块。也就是,可以设计部分或全部模块来实现相应的功能,而被设计的这些模块,
可以全部或部分集成在芯片中。
[0100]
依据本发明实施例公开的一种敲击行为识别方法、装置和耳机,在预设时长内获取麦克风采集的音频信号,提取音频信号的音频特征,音频特征包括相似度、梯度和峰均比之一或任意组合,由此可以区分敲击信号和抖动信号,从而能够提取音频信号中的敲击信号得到敲击信号序列,基于此按预设的对应关系确定敲击信号序列对应的用户的控制操作。相对于传统方案通过振动传感器检测敲击信号,本发明实施例以耳机原本自带的麦克风作为敲击传感器识别敲击,减少了使用专用振动传感器的使用成本,也就是减少了额外的硬件成本,具有可行性高、经济、有效的特点。
[0101]
此外,本发明还提供了一种计算机可读存储介质,如芯片、光盘等,计算机可读存储介质上存储有执行程序,该执行程序被执行时实现如上述任一项所述的方法。
[0102]
需要说明的是,本公开的实施例所述的计算机可读存储介质并不限定于上述所给实施例,例如还可以为电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开的实施例中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。
[0103]
本领域的技术人员能够理解的是,在不冲突的前提下,上述各优选方案可以自由地组合、叠加。其中,附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生,例如,两个接连表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。本文中对于各步骤的编号仅为了方便说明和引用,并不用于限定前后顺序,具体的执行顺序是由技术本身确定的,本领域技术人员可以根据技术本身确定各种允许的、合理的顺序。
[0104]
需要说明的是,本发明中采用步骤编号(字母或数字编号)来指代某些具体的方法步骤,仅仅是出于描述方便和简洁的目的,而绝不是用字母或数字来限制这些方法步骤的顺序。本领域的技术人员能够明了,相关方法步骤的顺序,应由技术本身决定,不应因步骤编号的存在而被不适当地限制,本领域技术人员可以根据技术本身确定各种允许的、合理的步骤顺序。
[0105]
本领域的技术人员能够理解的是,在不冲突的前提下,上述各优选方案可以自由地组合、叠加。
[0106]
应当理解,上述的实施方式仅是示例性的,而非限制性的,在不偏离本发明的基本原理的情况下,本领域的技术人员可以针对上述细节做出的各种明显的或等同的修改或替
换,都将包含于本发明的权利要求范围内。

技术特征:
1.一种敲击行为识别方法,应用于具有麦克风采集音频功能的耳机,其特征在于,所述方法包括:步骤s100,在预设时长内获取麦克风采集的音频信号,所述音频信号包含敲击信号;步骤s200,提取所述音频信号的音频特征,所述音频特征包括相似度、梯度和峰均比之一或任意组合;步骤s300,依据所述音频特征在所述预设时长内区分所述敲击信号和抖动信号,以提取所述音频信号中的敲击信号得到敲击信号序列,其中,所述抖动信号包含在所述音频信号中;步骤s400,依据所述敲击信号序列按预设的对应关系确定所述敲击信号序列对应的用户的控制操作。2.如权利要求1所述的敲击行为识别方法,其特征在于,所述耳机为主动降噪耳机,所述耳机包含参考麦克风和误差麦克风;在所述步骤s100中,获取通过所述误差麦克风采集的音频信号。3.如权利要求2所述的敲击行为识别方法,其特征在于,所述步骤s100包括:对所述误差麦克风采集的信号进行预设倍数的下采样处理后得到所述音频信号。4.如权利要求1-3任意一项所述的敲击行为识别方法,其特征在于,在所述步骤s300中,被识别为所述敲击信号的信号特征为相邻时段的波形相似度超过第一阈值,该信号与相邻采样点的信号的幅值梯度差超过第二阈值,且在预设时段内该信号对应的峰均比超过第三阈值。5.如权利要求1-3任意一项所述的敲击行为识别方法,其特征在于,在所述步骤s300中,被识别为所述抖动信号的信号特征为相邻时段的波形相似度小于第一阈值,该信号与相邻采样点的信号的幅值梯度超过第二阈值,且在预设时段内该信号对应的峰均比小于第三阈值。6.如权利要求4所述的敲击行为识别方法,其特征在于,在识别到存在所述抖动信号后,提高所述第一阈值、所述第二阈值和所述第三阈值,以自适应更新检测阈值。7.如权利要求4所述的敲击行为的识别方法,其特征在于,所述耳机包含成对的第一耳机和第二耳机,当第一耳机的脉冲最大值相对于第二耳机的脉冲最大值超过第四阈值时,确定在所述第一耳机上发生了敲击行为,并识别所述第一耳机的敲击信号。8.一种敲击行为识别装置,应用于具有麦克风采集音频功能的耳机,其特征在于,所述装置包括:音频信号获取模块(100),用于在预设时长内获取麦克风采集的音频信号,所述音频信号包含敲击信号;特征提取模块(200),用于提取所述音频信号的音频特征,所述音频特征包括相似度、梯度和峰均比之一或任意组合;敲击信号区分模块(300),用于依据所述音频特征在所述预设时长内区分所述敲击信号和抖动信号,以提取所述音频信号中的敲击信号得到敲击信号序列,其中,所述抖动信号包含在所述音频信号中;操作对应模块(400),用于依据所述敲击信号序列按预设的对应关系确定所述敲击信号序列对应的用户的控制操作。
9.如权利要求8所述的敲击行为识别装置,其特征在于,所述耳机为主动降噪耳机,所述耳机包含参考麦克风和误差麦克风;在所述音频信号获取模块(100)中,获取通过所述误差麦克风采集的音频信号。10.如权利要求9所述的敲击行为识别装置,其特征在于,所述音频信号获取模块(100)包括:对所述误差麦克风采集的信号进行预设倍数的下采样处理后得到所述音频信号。11.如权利要求8-10任意一项所述的敲击行为识别装置,其特征在于,在所述敲击信号区分模块(300)中,被识别为所述敲击信号的信号特征为相邻时段的波形相似度超过第一阈值,该信号与相邻采样点的信号的幅值梯度差超过第二阈值,且在预设时段内该信号对应的峰均比超过第三阈值。12.如权利要求8-10任意一项所述的敲击行为识别装置,其特征在于,在所述敲击信号区分模块(300)中,被识别为所述抖动信号的信号特征为相邻时段的波形相似度小于第一阈值,该信号与相邻采样点的信号的幅值梯度超过第二阈值,且在预设时段内该信号对应的峰均比小于第三阈值。13.如权利要求11所述的敲击行为识别装置,其特征在于,在识别到存在所述抖动信号后,提高所述第一阈值、所述第二阈值和所述第三阈值,以自适应更新检测阈值。14.如权利要求11所述的敲击行为的识别方法,其特征在于,所述耳机包含成对的第一耳机和第二耳机,当第一耳机的脉冲最大值相对于第二耳机的脉冲最大值超过第四阈值时,确定在所述第一耳机上发生了敲击行为,并识别所述第一耳机的敲击信号。15.一种耳机,具有麦克风采集音频功能,其特征在于,包括:处理器,用于实现如权利要求1-7任意一项所述的方法。16.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,存储介质中存储的计算机程序用于被处理器执行实现如权利要求1-7任意一项所述的方法。17.一种音频处理芯片,其上具有集成电路,其特征在于,所述集成电路被配置为实现如权利要求1-7任意一项所述的方法。

技术总结
本发明提供一种敲击行为识别方法、装置、芯片和耳机,所述方法包括:步骤S100,在预设时长内获取麦克风采集的音频信号,音频信号包含敲击信号;步骤S200,提取音频信号的音频特征,音频特征包括相似度、梯度和峰均比之一或任意组合;步骤S300,依据音频特征在预设时长内区分敲击信号和抖动信号,以提取音频信号中的敲击信号得到敲击信号序列,其中,抖动信号包含在音频信号中;步骤S400,依据敲击信号序列按预设的对应关系确定敲击信号序列对应的用户的控制操作。减少了使用专用振动传感器的使用成本,也就是减少了额外的硬件成本,具有可行性高、经济、有效的特点。有效的特点。有效的特点。


技术研发人员:方泽凯 朱嘉俊 毛伟文
受保护的技术使用者:珠海市杰理科技股份有限公司
技术研发日:2023.08.01
技术公布日:2023/10/20
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐