一种多应用语音采集的方法、拾音设备及系统与流程

未命名 09-24 阅读:65 评论:0


1.本技术涉及音频数据处理领域,特别涉及一种多应用语音采集的方法、拾音设备及系统。


背景技术:

2.随着互联网技术的不断发展,依托于互联网的会话越来越普及,用户甲乙双方通过互联网进行远程视频会议变得越来越普通。
3.当用户甲和用户乙进行远程视频会议时,由于麦克风采集扬声器的声音后会产生啸叫声,目前的会议系统会使用技术手段将麦克风采集的扬声器的声音给抵消掉。
4.但是由于用户甲和用户乙双方使用不同语音,存在语音障碍,因此需要借助翻译软件将对话说话内容翻译成本国语言,为了解决啸叫声,通过主动降噪技术,将麦克风采集的扬声器的声音给抵消掉了,进而使得翻译软件无法采集说话内容,从而无法对说话内容进行翻译。


技术实现要素:

5.基于此,有必要针对上述技术问题,提供一种多应用语音采集的方法、拾音设备及系统,能够使得翻译应用程序顺利采集音频数据并进行翻译。
6.第一方面,本技术实施例提供了一种多应用语音采集的方法,应用于拾音设备,所述方法包括:
7.从第一终端的第一扬声器采集第二终端的第二目标应用程序发送的音频数据;
8.对所述音频数据进行处理,得到第一音频数据;
9.将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频数据进行二次处理,得到第二音频数据;
10.将所述第二音频数据发送给翻译应用程序,以使所述翻译应用程序对所述第二音频数据进行翻译。
11.在一些实施例中,所述音频数据包括环境语音和音频语音。
12.在一些实施例中,所述对所述音频数据进行处理,得到第一音频数据,包括:
13.对所述音频数据进行分包、编码以及压缩处理,得到第一音频数据。
14.在一些实施例中,所述将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频信号进行二次数据,得到第二音频数据,包括:
15.将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频信号进行解压缩、解码处理,得到第二音频数据。
16.第二方面,本技术实施例还提供了一种拾音设备,包括:
17.第三麦克风;
18.第一处理单元,所述第一处理单元和所述第三麦克风连接,用于对音频数据进行处理;
19.第一通信单元,所述第一信单元和所述第一处理单元连接,用于将所述音频数据发送给第二通信单元;
20.其中,所述第一处理单元包括:
21.至少一个处理器;以及,
22.与所述至少一个处理器通信连接的存储器;其中,
23.所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行上述方法。
24.第三方面,本技术实施例还提供了一种多应用语音采集系统,所述系统包括第二方面的拾音设备、第二通信单元和第二处理单元,所述第二通信单元分别和所述拾音设备以及所述第二处理单元连接,
25.所述第二通信单元用于接收所述拾音设备发送的音频数据,并将所述音频数据发送给第二处理单元进行二次处理。
26.在一些实施例中,所述拾音设备包括第三麦克风、第一处理单元以及第一通信单元,所述第一处理单元分别和所述第三麦克风以及所述第一通信单元连接。
27.在一些实施例中,所述拾音设备为拾音器。
28.第四方面,本技术实施例还提供了一种非易失性计算机可读存储介质,所述计算机可读存储介质存储有计算机可执行指令,当所述计算机可执行指令被处理器所执行时,使所述处理器执行上述方法。
29.第五方面,本技术实施例还提供了一种计算机程序产品,所述计算机程序产品中存储有至少一条计算机指令,所述至少一条计算机指令由处理器加载并执行,以使计算机实现上述方法。
30.与现有技术相比,本技术的有益效果是:区别于现有技术的情况,本技术实施例提供的一种多应用语音采集的方法,通过从第一终端的第一扬声器采集第二终端的第二目标应用程序发送的音频数据,然后对所述音频数据进行处理,得到第一音频数据,接着将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频数据进行二次处理,得到第二音频数据,最后将所述第二音频数据发送给翻译应用程序,以使所述翻译应用程序对所述第二音频数据进行翻译,通过借助拾音设备低时延的音频传输方式,使得翻译应用程序能够顺利采集到音频数据并进行翻译。
附图说明
31.一个或多个实施例通过与之对应的附图中的图片进行示例性说明,这些示例性说明并不构成对实施例的限定,附图中具有相同参考数字标号的元件表示为类似的元件,除非有特别申明,附图中的图不构成比例限制。
32.图1是本技术实施例提供的一种多应用语音采集系统示意图;
33.图2是本技术实施例提供的一种多应用语音采集方法的流程示意图;
34.图3是本技术实施例提供的第一处理单元的硬件结构示意图。
具体实施方式
35.为使本技术实施例的目的、技术方案和优点更加清楚,下面将结合本技术实施例
中的附图,对本技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本技术一部分实施例,而不是全部的实施例。基于本技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本技术保护的范围。
36.需要说明的是,如果不冲突,本技术实施例中的各个特征可以相互结合,均在本技术的保护范围之内。另外,虽然在装置示意图中进行了功能模块划分,在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于装置中的模块划分,或流程图中的顺序执行所示出或描述的步骤。再者,本技术所采用的“第一”、“第二”、“第三”等字样并不对数据和执行次序进行限定,仅是对功能和作用基本相同的相同项或相似项进行区分。
37.本技术实施例提供的多应用语音采集的方法适用于图1所示的应用场景,所述应用场景为多应用语音采集系统,多应用语音采集系统100包括拾音设备30,第二通信单元13和第二处理单元14,所述第二通信单元13分别和所述拾音设备30以及所述第二处理单元14连接。所述第二通信单元13和所述第二处理单元14运行于所述第一终端10,所述第一终端设备10分别和所述第二终端20以及所述拾音设备30通信连接。
38.所述第一终端设备10设有第一麦克风11和第一扬声器12,所述第二终端设备20设有第二麦克风21和第二扬声器22,并且所述第一终端设备10安装运行有第一目标应用程序a和翻译应用程序b,所述第二终端20安装运行有第二目标应用程序d。其中,第一目标应用程序a和第二目标应用程序d例如可以为即时通讯类应用程序,社交类应用程序等。其中,所述第一终端10和所述第二终端20例如可以为智能手机、平板电脑、笔记本电脑、台式计算机等终端设备。所述拾音设备例如可以为拾音器。
39.进一步地,所述第一终端10还包括第二通信单元13和第二处理单元14,所述第二通信单元13和所述第二处理单元14通信连接。所述拾音设备30包括第三麦克风31、第一处理单元32以及第一通信单元33,所述第一处理单元32分别和所述第三麦克风以及所述第一通信单元33连接。其中,所述第一处理单元32用于对音频数据进行处理,所述第一通信单元33用于将经过处理后的音频数据发送给所述第二通信单元13,所述第二通信单元13用于将经过处理后的音频数据发送给第二处理单元14进行再次处理,然后通过接口传递给翻译应用程序b。
40.便于理解本系统,下面将结合附图对多应用语音采集的系统进行说明。如图1所示,第一用户和第二用户为互联网用户,第一用户为中国人,第二用户为外国人,第一用户和第二用户需要举行视频会议。第一用户使用第一终端10,第二用户使用第二终端20。由于第一用户和第二用户使用不同的语音,所以会存在语言障碍。因为需要借助翻译应用程序b将对话说话内容翻译成本国语言。但是市面上流行的会议系统都无此功能。
41.第一用户和第二用户进行对话,第一用户听到第二用户讲话的过程如下,第二用户通过第二终端20的第二麦克风21进行语音输入,第二终端20运行的第二目标应用程序d采集第二用户通过第二麦克风21输入的音频数据,然后将所述音频数据通过互联网传输给第一终端10。第一终端10上的第一扬声器12将所述音频数据进行播放,此时,第一用户能够听到第二用户的语音内容。但是由于第一用户和第二用户存在语言障碍,从而导致第一用户听不懂第二用户的语音内容。
42.承接上述例子,第二用户听到第一用户讲话的过程如下,第一用户通过第一终端10的第一麦克风11进行语音输入,第一终端10运行的第一目标应用程序a采集第一用户通
过第一麦克风11输入的音频数据,并且第一目标应用程序a还会采集通过第一扬声器12播放的第二用户的音频数据,当第一用户和第二用户反复进行对话时,两边的麦克风和扬声器反复的采集音频数据进行播放,由此会出现啸叫的噪声。
43.为了避免啸叫,通常是通过主动降噪消除技术,相位相反,互相抵消机制,将第一麦克风11从第一扬声器12中采集的声音给屏蔽掉,如此第二用户就不会从第二麦克风21中听到自己的语音,从而解决啸叫噪声。但是翻译应用程序b也无法从第一麦克风11中采集到第二用户的音频数据。
44.本技术为了解决该技术问题,引入了拾音设备30,拾音设备30通过第三麦克风31采集第一扬声器12播放的音频数据,所述音频数据包括环境语音和音频语音,然后通过第一处理单元32对音频数据进行分包、编码以及压缩处理,得到第一音频数据。然后将第一音频数据通过第一通信单元33传输给第二通信单元13,第二通信单元13将第一音频数据发送给所述第二处理单元14进行解压缩和解码处理,得到第二音频数据,第二处理单元14将第二音频数据通过接口传递给翻译应用程序b,以使所述翻译应用程序b对所述第二音频数据进行翻译。由此,通过借助拾音设备低时延的音频传输方式,使得翻译应用程序能够顺利采集到音频数据并进行翻译。
45.需要说明的是,本技术实施例提供的多应用语音采集的方法还可以应用于其他合适的应用场景中,在实际的应用过程中,还可以包括更多的终端。
46.如图2所示,本技术实施例提供了一种多应用语音采集的方法,所述方法由拾音设备执行,所述方法包括:
47.步骤210,从第一终端的第一扬声器采集第二终端的第二目标应用程序发送的音频数据。
48.在本技术实施例中,音频数据包括环境语音和音频语音。其中,音频语音为第一终端的第一扬声器播放的语音。具体地,第二终端的第二目标应用程序发送音频数据给第一终端后,第一终端的第一扬声器播放所述音频数据,视频设备采集第一扬声器播放的音频数据。
49.步骤220,对所述音频数据进行处理,得到第一音频数据。
50.具体地,对音频数据进行处理,首先利用第一处理单元对音频数据进行分包,然后对音频数据进行编码,最后对音频数据进行压缩,从而得到第一音频数据。需要说明的是,第一音频数据和下文的第二音频数据都是便于说明本技术而定义的,是相对概念,并不作为对本技术的限定。
51.步骤230,将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频数据进行二次处理,得到第二音频数据。
52.在本技术实施例中,对第一音频数据进行二次处理,通过第二处理单元对第一音频数据进行解压缩处理,然后对第一音频数据进行解码处理,进而得到第二音频数据。具体地,拾音设备的第一通信单元将第一音频数据发送给第一终端,第一终端的第二处理单元对所述第一音频数据进行解压缩和解码处理,从而得到第二音频数据。
53.步骤240,将所述第二音频数据发送给翻译应用程序,以使所述翻译应用程序对所述第二音频数据进行翻译。
54.第二处理单元将处理后的第二音频数据通过通信接口传递给翻译应用程序,翻译
only memory,rom)或随机存储记忆体(random access memory,ram)等。
65.最后应说明的是:以上实施例仅用以说明本技术的技术方案,而非对其限制;在本技术的思路下,以上实施例或者不同实施例中的技术特征之间也可以进行组合,步骤可以以任意顺序实现,并存在如上所述的本技术的不同方面的许多其它变化,为了简明,它们没有在细节中提供;尽管参照前述实施例对本技术进行了详细的说明,本领域的普通技术人员应当理解:其依然可以对前述各实施例所记载的技术方案进行修改,或者对其中部分技术特征进行等同替换;而这些修改或者替换,并不使相应技术方案的本质脱离本技术各实施例技术方案的范围。

技术特征:
1.一种多应用语音采集的方法,应用于拾音设备,其特征在于,所述方法包括:从第一终端的第一扬声器采集第二终端的第二目标应用程序发送的音频数据;对所述音频数据进行处理,得到第一音频数据;将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频数据进行二次处理,得到第二音频数据;将所述第二音频数据发送给翻译应用程序,以使所述翻译应用程序对所述第二音频数据进行翻译。2.根据权利要求1所述的方法,其特征在于,所述音频数据包括环境语音和音频语音。3.根据权利要求2所述的方法,其特征在于,所述对所述音频数据进行处理,得到第一音频数据,包括:对所述音频数据进行分包、编码以及压缩处理,得到第一音频数据。4.根据权利要求3所述的方法,其特征在于,所述将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频信号进行二次数据,得到第二音频数据,包括:将所述第一音频数据发送给所述第一终端,以使所述第一终端对所述第一音频信号进行解压缩、解码处理,得到第二音频数据。5.一种拾音设备,其特征在于,包括:第三麦克风;第一处理单元,所述第一处理单元和所述第三麦克风连接,用于对音频数据进行处理;第一通信单元,所述第一信单元和所述第一处理单元连接,用于将所述音频数据发送给第二通信单元;其中,所述第一处理单元包括:至少一个处理器;以及,与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器能够执行权利要求1-4任一项所述的方法。6.一种多应用语音采集系统,其特征在于,所述系统包括权利要求5所述的拾音设备、第二通信单元和第二处理单元,所述第二通信单元分别和所述拾音设备以及所述第二处理单元连接,所述第二通信单元用于接收所述拾音设备发送的音频数据,并将所述音频数据发送给第二处理单元进行二次处理。7.根据权利要求6所述的系统,其特征在于,所述拾音设备包括第三麦克风、第一处理单元以及第一通信单元,所述第一处理单元分别和所述第三麦克风以及所述第一通信单元连接。8.根据权利要求7所述的系统,其特征在于,所述拾音设备为拾音器。9.一种非易失性计算机可读存储介质,其特征在于,所述计算机可读存储介质存储有计算机可执行指令,当所述计算机可执行指令被处理器所执行时,使所述处理器执行如权利要求1-4任一项所述的方法。10.一种计算机程序产品,其特征在于,所述计算机程序产品中存储有至少一条计算机指令,所述至少一条计算机指令由处理器加载并执行,以使计算机实现如权利要求1-4任一
项所述的方法。

技术总结
本申请涉及音频数据处理领域,公开了一种多应用语音采集的方法、拾音设备及系统。方法包括,从第一终端的第一扬声器采集第二终端的第二目标应用程序发送的音频数据;对音频数据进行处理,得到第一音频数据;将第一音频数据发送给第一终端,以使第一终端对第一音频数据进行二次处理,得到第二音频数据;将第二音频数据发送给翻译应用程序,以使翻译应用程序对第二音频数据进行翻译,通过借助拾音设备低时延的音频传输方式,使得翻译应用程序能够顺利采集到音频数据并进行翻译。采集到音频数据并进行翻译。采集到音频数据并进行翻译。


技术研发人员:王勇 黄朝敏 吴振志 吴涵渠
受保护的技术使用者:武汉市奥拓智能科技有限公司
技术研发日:2022.03.16
技术公布日:2023/9/22
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

飞机超市 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

相关推荐