一种视频进度调整方法、装置、电子设备及存储介质与流程

未命名 09-29 阅读:73 评论:0


1.本公开涉及视频播控的技术领域,具体涉及一种视频进度调整方法、装置、电子设备及存储介质。


背景技术:

2.在视频播放过程中,相关技术通过将视频内容快进或快退固定的时间,以满足用户对视频的进度调整需求,但在应用发现,通过上述的进度调整方式,用户很难精准定位到预期的视频位置,这使得进度调整后的视频内容存在一定的冗余或缺失,也就是说,基于相关技术实现的进度调整的调整效果较差。


技术实现要素:

3.本公开的目的在于提供一种视频进度调整方法、装置、电子设备及存储介质,用于解决相关技术在视频进度调整过程中存在的调整效果差的技术问题。
4.第一方面,本公开提供一种视频进度调整方法,所述方法包括:
5.获取交互指令,其中,所述交互指令产生于目标视频的字幕交互区域,所述目标视频的字幕显示区域位于所述字幕交互区域中;
6.根据所述交互指令,生成字幕调整指令;
7.根据所述字幕调整指令,将目标视频当前显示的第一字幕调整为第二字幕,以及将所述目标视频当前显示的第一视频帧调整为第二视频帧,其中,所述第二视频帧为所述目标视频中包括所述第二字幕的视频帧。
8.在一个实施例中,所述获取交互指令之前,所述方法还包括:
9.在所述字幕显示区域展示所述第一字幕和第三字幕;
10.或者,
11.在所述字幕显示区域展示所述第一字幕和第四字幕;
12.或者,
13.在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;
14.其中,第三字幕为所述目标视频中字幕显示时间早于所述第一字幕的字幕,所述第四字幕为所述目标视频中字幕显示时间晚于所述第一字幕的字幕。
15.在一个实施例中,所述在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕,包括:
16.以六棱柱形式在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;其中,所述第三字幕位于所述第一字幕上方,所述第四字幕位于所述第一字幕下方。
17.在一个实施例中,所述方法还包括:
18.在所述第一字幕为所述目标视频的第一个字幕的情况下,所述第三字幕包括第一链接,所述第一链接用于显示预设的第一提示信息,或者,所述第一链接用于播放所述目标视频的第一相关视频,所述第一相关视频为所述目标视频对应的剧集中,与所述目标视频
相邻且位于所述目标视频之前的视频;
19.在所述第一字幕为所述目标视频的最后一个字幕的情况下,所述第四字幕包括第二链接,所述第二链接用于显示预设的第二提示信息,或者,所述第二链接用于播放所述目标视频的第二相关视频,所述第二相关视频为所述目标视频对应的剧集中,与所述目标视频相邻且位于所述目标视频之后的视频。
20.在一个实施例中,所述交互指令包括交互起点和交互终点,所述交互起点用于指示用户交互行为在所述字幕交互区域的起始位置,所述交互中点用于指示用户交互行为在所述字幕交互区域的结束位置;
21.所述根据所述交互指令,生成所述字幕调整指令,包括:
22.根据所述交互起点和所述交互终点确定字幕调整方向,
23.根据所述字幕调整方向生成所述字幕调整指令。
24.在一个实施例中,所述根据所述字幕调整方向生成所述字幕调整指令,包括:
25.根据所述交互起点和所述交互终点,确定所述用户交互行为在所述字幕交互区域的移动距离;
26.根据所述移动距离以及距离调整系数,确定字幕调整个数,其中,所述距离调整系数根据所述字幕交互区域的宽度和所述字幕交互区域对应的最大弹幕个数确定,或者,所述距离调整系数根据所述第一字幕的字幕宽度确定;
27.根据所述字幕调整方向和所述字幕调整个数生成所述字幕调整指令。
28.在一个实施例中,所述字幕交互区域包括第一交互子区域和第二交互子区域;
29.所述根据所述交互指令,生成所述字幕调整指令,包括:
30.根据所述交互指令的触发区域确定字幕调整方向,其中,所述触发区域为所述第一交互子区域或所述第二交互子区域;
31.根据所述字幕调整方向生成所述字幕调整指令。
32.第二方面,本公开还提供一种视频进度调整装置,所述装置包括:
33.获取模块,用于获取交互指令,其中,所述交互指令产生于目标视频的字幕交互区域,所述目标视频的字幕显示区域位于所述字幕交互区域中;
34.生成模块,用于根据所述交互指令,生成字幕调整指令;
35.调整模块,用于根据所述字幕调整指令,将目标视频当前显示的第一字幕调整为第二字幕,以及将所述目标视频当前显示的第一视频帧调整为第二视频帧,其中,所述第二视频帧为所述目标视频中包括所述第二字幕的视频帧。
36.第三方面,本公开实施例还提供一种电子设备,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现上述视频进度调整方法的步骤。
37.第四方面,本公开实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述视频进度调整方法的步骤。
38.在本公开中,通过关联目标视频的字幕和视频帧,以在基于用户指令调整目标视频的字幕进度时,一并完成对目标视频的视频帧调整,这使得用户可以将字幕作为视频调整时的参照对象,实现对视频进度的精准调控,从而降低调整后的视频内容出现的冗余或
缺失的概率,提升视频调整效果。
附图说明
39.图1是本公开实施例提供的一种视频进度调整方法的示意图;
40.图2是本公开实施例提供的一种视频播放区域和字幕显示区域的示意图;
41.图3是本公开实施例提供的一种六棱柱字幕样式的示意图;
42.图4是本公开实施例提供的字幕回退方向的交互轨迹的示意图;
43.图5是本公开实施例提供的字幕快进方向的交互轨迹的示意图;
44.图6是本公开实施例提供的一种字幕交互区域的示意图;
45.图7是本公开实施例提供的一种视频进度调整装置的结构示意图;
46.图8是本公开实施例提供的一种电子设备的示意图。
具体实施方式
47.下面将结合本公开实施例中的附图,对本公开实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本公开一部分实施例,而不是全部的实施例。基于本公开中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本公开保护的范围。
48.本公开实施例提供一种视频进度调整方法,如图1所示,所述视频进度调整方法包括:
49.步骤101、获取交互指令,其中,所述交互指令产生于目标视频的字幕交互区域,所述目标视频的字幕显示区域位于所述字幕交互区域中。
50.示例性的,上述目标视频可以为电影、影视剧、综艺录屏、晚会录屏等。
51.其中,上述字幕交互区域的设置,通过匹配用户对于智能设备的操作习惯,能便利用户与字幕显示区域中的字幕之间的交互,为用户提供更优的视频播放体验,例如:用户可通过手势控制的方式,在字幕交互区域进行相应的交互操作,进而实现对字幕显示区域内的字幕的滚动或拨动。
52.需要说明的是,在应用本公开所述方法之前,若目标视频内存在字幕,则本公开所述字幕显示区域覆盖所述目标视频原有的字幕显示区域上,且所述目标视频原有的字幕显示区域位于本公开所述字幕显示区域的中间;
53.在应用本公开所述方法之前,若目标视频内不存在字幕,则本公开所述字幕显示区域基于预设区域参数确定,且所述字幕显示区域的竖直中线和所述目标视频的视频显示区域的竖直中线相同,其中,所述预设区域参数包括:
54.指示所述字幕显示区域的中心点位置的第一坐标,指示所述字幕显示区域的长度的第二参数,指示所述字幕显示区域的宽度的第三参数;
55.和/或,
56.指示所述字幕显示区域的左上顶点位置的第二坐标,指示所述字幕显示区域的右下顶点位置的第三坐标;
57.和/或,
58.指示所述字幕显示区域的右上顶点位置的第四坐标,指示所述字幕显示区域的左
下顶点位置的第五坐标。
59.举例来说,若基于前述第一坐标、第二坐标、第三坐标、第四坐标以及第五坐标确定所述字幕显示区域时,如图2所示,图2中虚线框所围区域为字幕显示区域,图2中实线框所围区域为目标视频的视频播放区域,图2中虚线为所述字幕显示区域的竖直中线,所述第一坐标可以为(0,0),所述第二坐标可以为(-5,1),所述第三坐标可以为(5,-1),所述第四坐标可以为(5,1),所述第五坐标可以为(-5,-1)。
60.步骤102、根据所述交互指令,生成字幕调整指令。
61.所述字幕调整指令用于对目标视频当前显示的字幕进行快进或快退处理。
62.步骤103、根据所述字幕调整指令,将目标视频当前显示的第一字幕调整为第二字幕,以及将所述目标视频当前显示的第一视频帧调整为第二视频帧。
63.其中,所述第二视频帧为所述目标视频中包括所述第二字幕的视频帧。
64.需要指出的是,本公开中的目标视频的字幕和视频帧相互关联,具体关联方式为:将一个字幕和包括有该字幕的至少一个视频帧相互关联。
65.在本公开中,通过关联目标视频的字幕和视频帧,以在基于用户指令调整目标视频的字幕进度时,一并完成对目标视频的视频帧调整,这使得用户可以将字幕作为视频调整时参照对象,实现对视频进度精准调控,从而降低调整后的视频内容出现的冗余或缺失的概率,提升视频调整效果。
66.在一示例中,所述第二字幕可以为包括所述第二字幕的多个视频帧中播放时间最早的视频帧,这能使第二字幕对应的视频内容得以完整播放,以此来保障进度调整后的视频内容的完整性,进一步提升视频调整效果。
67.需要说明的是,目标视频的字幕是根据目标视频的字幕文件获得的,其中,字幕文件的获取方式可以为:
68.在目标视频没有字幕的情况下,通过语音识别算法(automatic speech recognition,asr)对目标视频的音频进行识别,即可相应生成所述字幕文件;
69.在目标视频存在有内嵌式字幕的情况下,通过asr对目标视频的音频进行识别(或通过光学字符识别(optical character recognition,ocr)技术对目标视频的内嵌式字幕进行识别),以得到所述字幕文件;
70.在目标视频存在有外挂字幕文件的情况下,直接将所述外挂字幕文件作为所述字幕文件。
71.示例性的,在获取前述字幕文件后,可以将字幕文件中每个字幕的起始时间戳作为键(key),由字幕的结束时间戳、字幕长度、字幕内容、上一个字幕的起始时间戳、下一个字幕的起始时间戳构成的数组作为值(value),以得到与字幕文件中多个字幕一一对应的多个键值对;当根据字幕调整指令确定所述第二字幕后,即可基于第二字幕对应的键值对获取第二字幕的起始时间戳,以在将目标视频当前显示的第一字幕切换为第二字幕的同时,将目标视频的视频进度跳转至第二字幕的起始时间戳所指示的时间节点。
72.该示例中,还可以在上一个/下一个字幕起始时间戳中加入up/down的标识,在对字幕调整指令进行响应时,先确定字幕调整指令为快进/后退操作,然后根据up/down的标识去查找对应的上一个/下一个字幕,这能缩短第二字幕的定位时间,并减少用于定位第二字幕的系统开销。
73.在一个实施例中,所述获取交互指令之前,所述方法还包括:
74.在所述字幕显示区域展示所述第一字幕和第三字幕;
75.或者,
76.在所述字幕显示区域展示所述第一字幕和第四字幕;
77.或者,
78.在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;
79.其中,第三字幕为所述目标视频中字幕显示时间早于所述第一字幕的字幕,所述第四字幕为所述目标视频中字幕显示时间晚于所述第一字幕的字幕。
80.该实施例中,在字幕显示区域展示当前的第一字幕的同时,通过在字幕显示区域补充展示所述第三字幕和/或所述第四字幕,为用户提供更加完整的字幕信息,以此来便利用户对字幕内容的理解,提升用户的视频播放体验。
81.在一示例中,第三字幕的数量和第四字幕的数量都可以为一个,此时,所述第三字幕应理解为所述第一字幕的上一个字幕,所述第四字幕应理解为所述第一字幕的下一个字幕。
82.在另一示例中,所述第三字幕的数量和第四字幕的数量可以分别为n个和m个,n和m均为大于1的整数,此时,n个第三字幕可以为所述第一字幕的前n个字幕,m个第四字幕可以为所述第一字幕的后m个字幕。
83.在一个实施例中,所述在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕,包括:
84.以六棱柱形式在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;其中,所述第三字幕位于所述第一字幕上方,所述第四字幕位于所述第一字幕下方。
85.该实施例中,通过六棱柱形式对所述第一字幕、所述第三字幕和所述第四字幕进行展示,不仅能便利用户对第一字幕、第三字幕和第四字幕的区分,还能为用户更为友好的字幕调整体验,进一步提升用户的视频播放体验。
86.示例性的,如图3所示,通过六棱柱形式对所述第一字幕、所述第三字幕和所述第四字幕进行展示的情况下,六棱柱仅有三个柱面显示在字幕显示区域中,六棱柱的剩余三个柱面则呈隐藏状态,当字幕调整时,六棱柱会基于字幕的调整方向和调整数量进行相应转动,以动态显示字幕调整过程。
87.图3中,虚线框所围区域为前述字幕交互区域,实线框所围区域为前述视频播放区域,第一字幕所在的柱面和第三字幕所在的柱面之间夹角为60
°
,第一字幕所在的柱面和第四字幕所在的柱面之间夹角也为60
°

88.应用中,可以为第一字幕、第三字幕、第四字幕设置不同的字幕显示样式,以便于用户对第一字幕、第三字幕、第四字幕的区分。
89.需要说明的是,当第三字幕和第四字幕的数量为多个时,也可以通过适配多个第三字幕和多个第四字幕的多棱柱形式进行字幕展示,例如:当第三字幕和第四字幕数量均为2时,可以通过十棱柱形式对第一字幕、2个第三字幕、2个第四字幕进行展示。
90.需要指出的是,实际应用时,除了应用多棱柱形式对多字幕进行展示外,还可以应用其他字幕框样式对多字幕进行展示。
91.在一个实施例中,所述方法还包括:
92.在所述第一字幕为所述目标视频的第一个字幕的情况下,所述第三字幕包括第一链接,所述第一链接用于显示预设的第一提示信息,或者,所述第一链接用于播放所述目标视频的第一相关视频,所述第一相关视频为所述目标视频对应的剧集中,与所述目标视频相邻且位于所述目标视频之前的视频;
93.在所述第一字幕为所述目标视频的最后一个字幕的情况下,所述第四字幕包括第二链接,所述第二链接用于显示预设的第二提示信息,或者,所述第二链接用于播放所述目标视频的第二相关视频,所述第二相关视频为所述目标视频对应的剧集中,与所述目标视频相邻且位于所述目标视频之后的视频。
94.该实施例中,针对第一字幕为目标视频的第一个字幕或最后一个字幕的情况,通过在缺失对应字幕内容的第三字幕或第四字幕设置提示信息或视频播放触点,以避免字幕内容缺失的情况;这其中,将第三字幕或第四字幕设置为用于播放第一相关视频或第二相关视频的触点,则能简化用户对目标视频的前一个视频或后一个视频的播放流程,进一步提升用户的视频播放体验。
95.其中,第一提示信息用于提醒用户当前视频内容为目标视频的开头,第二提示信息用于提醒用户当前视频内容为目标视频的结尾,示例性的,所述第一提示信息和所述第二提示信息可以基于提示控件(toast)进行展示。
96.应用中,当用户点击所述第一链接或第二链接后,视频播放区域则会对应播放第一相关视频的起始视频帧或第二相关视频的起始视频帧。
97.示例性的,当所述目标视频为电影时,则所述目标视频对应的剧集可理解为系列电影;当所述目标视频为综艺节目时,则所述目标视频对应的剧集可理解为该综艺节目的视频集合。
98.在一个实施例中,所述交互指令包括交互起点和交互终点,所述交互起点用于指示用户交互行为在所述字幕交互区域的起始位置,所述交互中点用于指示用户交互行为在所述字幕交互区域的结束位置;
99.所述根据所述交互指令,生成所述字幕调整指令,包括:
100.根据所述交互起点和所述交互终点确定字幕调整方向,
101.根据所述字幕调整方向生成所述字幕调整指令。
102.该实施例中,根据用户交互行为的起点位置和终点位置,以确定用户交互行为的手势指向,进而确定字幕调整方向,满足用户通过手势进行字幕调整的需求,进一步提升用户的视频播放体验。
103.如图4所示,图4中的虚线为字幕交互区域的水平中线,当自交互起点指向交互终点的直线朝所述水平中线的上方延伸时,则指示字幕调整方向为回退(向上)方向,此时,第二字幕为字幕显示时间早于所述第一字幕的字幕。
104.如图5所示,图5中的虚线为字幕交互区域的水平中线,当自交互起点指向交互终点的直线朝所述水平中线的下方延伸时,则指示字幕调整方向为快进(向下)方向,此时,第二字幕为字幕显示时间晚于所述第一字幕的字幕。
105.示例性的,如表1所示:
106.表1
[0107][0108]
表1中,n为正整数,且取值范围为1至3。
[0109]
在一个实施例中,所述根据所述字幕调整方向生成所述字幕调整指令,包括:
[0110]
根据所述交互起点和所述交互终点,确定所述用户交互行为在所述字幕交互区域的移动距离;
[0111]
根据所述移动距离以及距离调整系数,确定字幕调整个数,其中,所述距离调整系数根据所述字幕交互区域的宽度和所述字幕交互区域对应的最大弹幕个数确定,或者,所述距离调整系数根据所述第一字幕的字幕宽度确定;
[0112]
根据所述字幕调整方向和所述字幕调整个数生成所述字幕调整指令。
[0113]
该实施例中,通过确定用户交互行为在字幕交互区域的移动距离,以及对应的距离调整系数,简化用户对于预设数量内的多个字幕的快速调整流程,提升用户在字幕调整过程中的使用体验。
[0114]
其中,所述移动距离为所述交互轨迹在字幕交互区域中的长度,所述交互轨迹为以所述交互起点和所述交互终点作为端点形成的线段。
[0115]
所述距离调整系数用于指示快进或回退一个字幕在字幕交互区域中所需的最小距离,所述字幕调整个数为所述移动距离和所述距离调整系数之比;需要说明的是,当所述移动距离和所述距离调整系数之比为非整数时,可通过向下取整或向上取整的方式对计算得到的比值进行调整。
[0116]
其中,所述字幕交互区域的宽度为所述字幕交互区域在其竖直中线的延伸方向上的距离,且所述距离调整系数为所述字幕交互区域的宽度和所述字幕交互区域对应的最大弹幕个数之比。
[0117]
举例来说,若所述字幕交互区域的宽度为10单位,所述字幕交互区域对应的最大弹幕个数为5个,则所述距离调整系数为2单位/个。
[0118]
所述第一字幕的字幕宽度为所述第一字幕在字幕交互区域的竖直中线的延伸方向上的距离,所述第一字幕的字幕宽度的宽度值即等于所述距离调整系数的系数值。
[0119]
举例来说,若第一字幕的字幕宽度为1.5单位,则所述距离调整系数为1.5单位/
个。
[0120]
在一些实施方式中,在假定用户的手势移动为匀速运动的情况下,也可以基于用户的手势移动速率来确定字幕调整个数。
[0121]
其中,用户的手势移动的移动距离为用户手势移动轨迹的物理距离,为避免不同客户端的像素尺寸不同带来的距离测算误差,可以基于公式(1)先计算用户手势移动轨迹的像素距离:
[0122]
dis = sqrt((x1-x2)^2+(y1-y2)^2) (1)
[0123]
式(1)中,用户手势移动轨迹的像素距离为dis,x1和x2分别为交互起点和交互终点在字幕交互区域的横坐标,y1和y2分别为交互起点和交互终点在字幕交互区域的纵坐标;
[0124]
随后,基于公式(2)计算用户手势移动轨迹的物理距离:
[0125]
dis*(s/px)(2)
[0126]
式(2)中,s为客户端的视频播放区域的纵向的物理尺寸,px为客户端的视频播放区域的纵向的像素块数量。
[0127]
用户手势移动轨迹的移动时间为(te-ts),其中,ts为交互起点的触发时刻,te为交互终点的触发时刻。
[0128]
最后,基于公式(3)计算用户的字幕调整个数:
[0129]
k*(dis*(s/px))/(te-ts)(3)
[0130]
式(3)中,k指示速度调整系数,k为正数,用户的手势移动速率越快,则对应的字幕调整个数越多。
[0131]
在一些实施方式中,还可以通过监测用户的手势移动力度来确定对应的字幕调整个数,其中,移动力度越大,则字幕调整个数越少。
[0132]
在一个实施例中,所述字幕交互区域包括第一交互子区域和第二交互子区域;
[0133]
所述根据所述交互指令,生成所述字幕调整指令,包括:
[0134]
根据所述交互指令的触发区域确定字幕调整方向,其中,所述触发区域为所述第一交互子区域或所述第二交互子区域;
[0135]
根据所述字幕调整方向生成所述字幕调整指令。
[0136]
该实施例中,通过设定第一交互子区域和第二交互子区域的方式,使得用户可通过点击的方式快速完成字幕调整操作,这进一步简化了用户的字幕调整流程,能提升用户的字幕调整体验。
[0137]
其中,如图6所示,图6中虚线为字幕交互区域的水平中线,该水平中线将字幕交互区域分割为两个子区域,其中,位于水平中线上方的子区域为第一交互子区域,位于水平中线下方的子区域为第二交互子区域;
[0138]
若设定第一交互子区域对应回退方向,第二交互子区域对应快进方向,则当用户点击第一交互子区域时,则指示用户当前期望对字幕进行回退;同理,当用户点击第二交互子区域时,则指示用户当前期望对字幕进行快进。
[0139]
具体的,可以基于用户的点击次数,确定回退或快进的字幕个数;并且,当用户长按时,则执行持续回退或快进字幕的处理,直至用户松开控制。
[0140]
该实施例中,前述第一字幕位于所述字幕交互区域的中心。
[0141]
在一个实施例中,所述方法还包括:
[0142]
获取用于调整所述目标视频的字幕的语音信息;
[0143]
对所述语音信息进行识别,得到所述字幕调整指令。
[0144]
该实施例中,通过识别语音信息,并基于识别结果生成字幕调整指令的方式,以匹配用户对字幕的语音调整需求,进一步简化用户对字幕的调整流程,提升用户在字幕调整过程中的使用体验。
[0145]
参见图7,图7是本公开实施例提供的一种视频进度调整装置,如图7所示,所述视频进度调整装置700包括:
[0146]
获取模块701,用于获取交互指令,其中,所述交互指令产生于目标视频的字幕交互区域,所述目标视频的字幕显示区域位于所述字幕交互区域中;
[0147]
生成模块702,用于根据所述交互指令,生成字幕调整指令;
[0148]
调整模块703,用于根据所述字幕调整指令,将目标视频当前显示的第一字幕调整为第二字幕,以及将所述目标视频当前显示的第一视频帧调整为第二视频帧,其中,所述第二视频帧为所述目标视频中包括所述第二字幕的视频帧。在一个实施例中,所述视频进度调整装置700还包括字幕展示模块,所述字幕展示模块,用于:
[0149]
在所述字幕显示区域展示所述第一字幕和第三字幕;
[0150]
或者,
[0151]
在所述字幕显示区域展示所述第一字幕和第四字幕;
[0152]
或者,
[0153]
在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;
[0154]
其中,第三字幕为所述目标视频中字幕显示时间早于所述第一字幕的字幕,所述第四字幕为所述目标视频中字幕显示时间晚于所述第一字幕的字幕。
[0155]
在一个实施例中,所述字幕展示模块,具体用于:
[0156]
以六棱柱形式在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;其中,所述第三字幕位于所述第一字幕上方,所述第四字幕位于所述第一字幕下方。
[0157]
在一个实施例,在所述第一字幕为所述目标视频的第一个字幕的情况下,所述第三字幕包括第一链接,所述第一链接用于显示预设的第一提示信息,或者,所述第一链接用于播放所述目标视频的第一相关视频,所述第一相关视频为所述目标视频对应的剧集中,与所述目标视频相邻且位于所述目标视频之前的视频;
[0158]
在所述第一字幕为所述目标视频的最后一个字幕的情况下,所述第四字幕包括第二链接,所述第二链接用于显示预设的第二提示信息,或者,所述第二链接用于播放所述目标视频的第二相关视频,所述第二相关视频为所述目标视频对应的剧集中,与所述目标视频相邻且位于所述目标视频之后的视频。
[0159]
在一个实施例中,所述交互指令包括交互起点和交互终点,所述交互起点用于指示用户交互行为在所述字幕交互区域的起始位置,所述交互中点用于指示用户交互行为在所述字幕交互区域的结束位置;
[0160]
所述指令生成子模块,包括:
[0161]
方向确定单元,用于根据所述交互起点和所述交互终点确定字幕调整方向,
[0162]
指令生成单元,用于根据所述字幕调整方向生成所述字幕调整指令。
[0163]
在一个实施例中,所述指令生成单元,包括:
[0164]
距离确定子单元,用于根据所述交互起点和所述交互终点,确定所述用户交互行为在所述字幕交互区域的移动距离;
[0165]
个数确定子单元,用于根据所述移动距离以及距离调整系数,确定字幕调整个数,其中,所述距离调整系数根据所述字幕交互区域的宽度和所述字幕交互区域对应的最大弹幕个数确定,或者,所述距离调整系数根据所述第一字幕的字幕宽度确定;
[0166]
指令生成子单元,用于根据所述字幕调整方向和所述字幕调整个数生成所述字幕调整指令。
[0167]
在一个实施例中,所述第一字幕位于所述字幕交互区域的中心,所述字幕交互区域包括第一交互子区域和第二交互子区域;
[0168]
所述指令生成单元,还用于:
[0169]
根据所述交互指令的触发区域确定字幕调整方向,其中,所述触发区域为所述第一交互子区域或所述第二交互子区域;
[0170]
根据所述字幕调整方向生成所述字幕调整指令。
[0171]
在一个实施例中,所述视频进度调整装置700还包括语音识别模块,所述语音识别模块具体用于:
[0172]
获取用于调整所述目标视频的字幕的语音信息;
[0173]
对所述语音信息进行识别,得到所述字幕调整指令。
[0174]
本公开实施例提供的视频进度调整装置700能够实现上述视频进度调整方法实施例中的各个过程,为避免重复,这里不再赘述。
[0175]
根据本公开的实施例,本公开还提供了一种电子设备、一种可读存储介质。
[0176]
图8示出了可以用来实施本公开的实施例的示例电子设备800的示意性框图。电子设备旨在表示各种形式的数字计算机,诸如,膝上型计算机、台式计算机、工作台、个人数字助理、服务器、刀片式服务器、大型计算机、和其它适合的计算机。电子设备还可以表示各种形式的移动装置,诸如,个人数字处理、蜂窝电话、智能电话、可穿戴设备和其它类似的计算装置。本文所示的部件、它们的连接和关系、以及它们的功能仅仅作为示例,并且不意在限制本文中描述的和/或者要求的本公开的实现。
[0177]
如图8所示,设备800包括计算单元801,其可以根据存储在只读存储器(read-only memory,rom)802中的计算机程序或者从存储单元808加载到随机访问存储器(random access memory,ram)803中的计算机程序,来执行各种适当的动作和处理。在ram 803中,还可存储设备800操作所需的各种程序和数据。计算单元801、rom 802以及ram 803通过总线804彼此相连。输入/输出(i/o)接口805也连接至总线804。
[0178]
设备800中的多个部件连接至i/o接口805,包括:输入单元806,例如键盘、鼠标等;输出单元807,例如各种类型的显示器、扬声器等;存储单元808,例如磁盘、光盘等;以及通信单元809,例如网卡、调制解调器、无线通信收发机等。通信单元809允许设备800通过诸如因特网的计算机网络和/或各种电信网络与其他设备交换信息/数据。
[0179]
计算单元801可以是各种具有处理和计算能力的通用和/或专用处理组件。计算单元801的一些示例包括但不限于中央处理单元(central processing unit,cpu)、图形处理单元(graphic process unit,gpu)、各种专用的人工智能(artificial intelligence,ai)
计算芯片、各种运行机器学习模型算法的计算单元、数字信号处理器(digital signal processing,dsp)、以及任何适当的处理器、控制器、微控制器等。计算单元801执行上文所描述的各个方法和处理,例如视频进度调整方法。例如,在一些实施例中,视频进度调整方法可被实现为计算机软件程序,其被有形地包含于机器可读介质,例如存储单元808。在一些实施例中,计算机程序的部分或者全部可以经由rom 802和/或通信单元809而被载入和/或安装到设备800上。当计算机程序加载到ram 803并由计算单元801执行时,可以执行上文描述的视频进度调整方法的一个或多个步骤。备选地,在其他实施例中,计算单元801可以通过其他任何适当的方式(例如,借助于固件)而被配置为执行视频进度调整方法。
[0180]
本文中以上描述的系统和技术的各种实施方式可以在数字电子电路系统、集成电路系统、场可编程门阵列(field-programmable gate array,fpga)、专用集成电路(application specific integrated circuit,asic)、专用标准产品(application specific standard product,assp)、芯片上系统的系统(system on chip,soc)、复杂可编程逻辑设备(complex programmable logic device,cpld)、计算机硬件、固件、软件、和/或它们的组合中实现。这些各种实施方式可以包括:实施在一个或者多个计算机程序中,该一个或者多个计算机程序可在包括至少一个可编程处理器的可编程系统上执行和/或解释,该可编程处理器可以是专用或者通用可编程处理器,可以从存储系统、至少一个输入装置、和至少一个输出装置接收数据和指令,并且将数据和指令传输至该存储系统、该至少一个输入装置、和该至少一个输出装置。
[0181]
用于实施本公开的方法的程序代码可以采用一个或多个编程语言的任何组合来编写。这些程序代码可以提供给通用计算机、专用计算机或其他可编程数据处理装置的处理器或控制器,使得程序代码当由处理器或控制器执行时使流程图和/或框图中所规定的功能/操作被实施。程序代码可以完全在机器上执行、部分地在机器上执行,作为独立软件包部分地在机器上执行且部分地在远程机器上执行或完全在远程机器或服务器上执行。
[0182]
在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
[0183]
为了提供与用户的交互,可以在计算机上实施此处描述的系统和技术,该计算机具有:用于向用户显示信息的显示装置(例如,crt(阴极射线管)或者lcd(液晶显示器)监视器);以及键盘和指向装置(例如,鼠标或者轨迹球),用户可以通过该键盘和该指向装置来将输入提供给计算机。其它种类的装置还可以用于提供与用户的交互;例如,提供给用户的反馈可以是任何形式的传感反馈(例如,视觉反馈、听觉反馈、或者触觉反馈);并且可以用任何形式(包括声输入、语音输入或者、触觉输入)来接收来自用户的输入。
[0184]
可以将此处描述的系统和技术实施在包括后台部件的计算系统(例如,作为数据服务器)、或者包括中间件部件的计算系统(例如,应用服务器)、或者包括前端部件的计算
系统(例如,具有图形用户界面或者网络浏览器的用户计算机,用户可以通过该图形用户界面或者该网络浏览器来与此处描述的系统和技术的实施方式交互)、或者包括这种后台部件、中间件部件、或者前端部件的任何组合的计算系统中。可以通过任何形式或者介质的数字数据通信(例如,通信网络)来将系统的部件相互连接。通信网络的示例包括:局域网(lan)、广域网(wan)和互联网。
[0185]
计算机系统可以包括客户端和服务器。客户端和服务器一般远离彼此并且通常通过通信网络进行交互。通过在相应的计算机上运行并且彼此具有客户端-服务器关系的计算机程序来产生客户端和服务器的关系。服务器可以是云服务器,也可以为分布式系统的服务器,或者是结合了区块链的服务器。
[0186]
应该理解,可以使用上面所示的各种形式的流程,重新排序、增加或删除步骤。例如,本公开中记载的各步骤可以并行地执行也可以顺序地执行也可以不同的次序执行,只要能够实现本公开公开的技术方案所期望的结果,本文在此不进行限制。
[0187]
上述具体实施方式,并不构成对本公开保护范围的限制。本领域技术人员应该明白的是,根据设计要求和其他因素,可以进行各种修改、组合、子组合和替代。任何在本公开的精神和原则之内所作的修改、等同替换和改进等,均应包含在本公开保护范围之内。

技术特征:
1.一种视频进度调整方法,其特征在于,所述方法包括:获取交互指令,其中,所述交互指令产生于目标视频的字幕交互区域,所述目标视频的字幕显示区域位于所述字幕交互区域中;根据所述交互指令,生成字幕调整指令;根据所述字幕调整指令,将目标视频当前显示的第一字幕调整为第二字幕,以及将所述目标视频当前显示的第一视频帧调整为第二视频帧,其中,所述第二视频帧为所述目标视频中包括所述第二字幕的视频帧。2.根据权利要求1所述的方法,其特征在于,所述获取交互指令之前,所述方法还包括:在所述字幕显示区域展示所述第一字幕和第三字幕;或者,在所述字幕显示区域展示所述第一字幕和第四字幕;或者,在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;其中,第三字幕为所述目标视频中字幕显示时间早于所述第一字幕的字幕,所述第四字幕为所述目标视频中字幕显示时间晚于所述第一字幕的字幕。3.根据权利要求2所述的方法,其特征在于,所述在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕,包括:以六棱柱形式在所述字幕显示区域展示所述第一字幕、所述第三字幕和所述第四字幕;其中,所述第三字幕位于所述第一字幕上方,所述第四字幕位于所述第一字幕下方。4.根据权利要求2所述的方法,其特征在于,所述方法还包括:在所述第一字幕为所述目标视频的第一个字幕的情况下,所述第三字幕包括第一链接,所述第一链接用于显示预设的第一提示信息,或者,所述第一链接用于播放所述目标视频的第一相关视频,所述第一相关视频为所述目标视频对应的剧集中,与所述目标视频相邻且位于所述目标视频之前的视频;在所述第一字幕为所述目标视频的最后一个字幕的情况下,所述第四字幕包括第二链接,所述第二链接用于显示预设的第二提示信息,或者,所述第二链接用于播放所述目标视频的第二相关视频,所述第二相关视频为所述目标视频对应的剧集中,与所述目标视频相邻且位于所述目标视频之后的视频。5.根据权利要求1所述的方法,其特征在于,所述交互指令包括交互起点和交互终点,所述交互起点用于指示用户交互行为在所述字幕交互区域的起始位置,所述交互中点用于指示用户交互行为在所述字幕交互区域的结束位置;所述根据所述交互指令,生成所述字幕调整指令,包括:根据所述交互起点和所述交互终点确定字幕调整方向,根据所述字幕调整方向生成所述字幕调整指令。6.根据权利要求5所述的方法,其特征在于,所述根据所述字幕调整方向生成所述字幕调整指令,包括:根据所述交互起点和所述交互终点,确定所述用户交互行为在所述字幕交互区域的移动距离;根据所述移动距离以及距离调整系数,确定字幕调整个数,其中,所述距离调整系数根
据所述字幕交互区域的宽度和所述字幕交互区域对应的最大弹幕个数确定,或者,所述距离调整系数根据所述第一字幕的字幕宽度确定;根据所述字幕调整方向和所述字幕调整个数生成所述字幕调整指令。7.根据权利要求1所述的方法,其特征在于,所述字幕交互区域包括第一交互子区域和第二交互子区域;所述根据所述交互指令,生成所述字幕调整指令,包括:根据所述交互指令的触发区域确定字幕调整方向,其中,所述触发区域为所述第一交互子区域或所述第二交互子区域;根据所述字幕调整方向生成所述字幕调整指令。8.一种视频进度调整装置,其特征在于,所述装置包括:获取模块,用于获取交互指令,其中,所述交互指令产生于目标视频的字幕交互区域,所述目标视频的字幕显示区域位于所述字幕交互区域中;生成模块,用于根据所述交互指令,生成字幕调整指令;调整模块,用于根据所述字幕调整指令,将目标视频当前显示的第一字幕调整为第二字幕,以及将所述目标视频当前显示的第一视频帧调整为第二视频帧,其中,所述第二视频帧为所述目标视频中包括所述第二字幕的视频帧。9.一种电子设备,其特征在于,包括处理器、存储器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1至7中任一项所述方法的步骤。10.一种可读存储介质,其特征在于,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述方法的步骤。

技术总结
本公开提供一种视频进度调整方法、装置、电子设备及存储介质,涉及视频播控的技术领域。所述方法包括:获取交互指令,其中,交互指令产生于目标视频的字幕交互区域,目标视频的字幕显示区域位于字幕交互区域中;根据交互指令,生成字幕调整指令;根据字幕调整指令,将目标视频当前显示的第一字幕调整为第二字幕,以及将目标视频当前显示的第一视频帧调整为第二视频帧,其中,第二视频帧为目标视频中包括第二字幕的视频帧。在本公开中,通过关联目标视频的字幕和视频帧,以在基于用户指令调整目标视频的字幕进度时,一并完成对目标视频的视频帧调整,使得用户可以将字幕作为视频调整时的参照对象,实现对视频进度的精准调控。实现对视频进度的精准调控。实现对视频进度的精准调控。


技术研发人员:奚晓钰 李立锋 宋微微
受保护的技术使用者:中国移动通信集团有限公司
技术研发日:2023.07.31
技术公布日:2023/9/26
版权声明

本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)

航空之家 https://www.aerohome.com.cn/

航空商城 https://mall.aerohome.com.cn/

航空资讯 https://news.aerohome.com.cn/

分享:

扫一扫在手机阅读、分享本文

评论

相关推荐