一种视频生成方法、装置、电子设备和存储介质与流程
未命名
09-23
阅读:48
评论:0
1.本公开涉及信息技术领域,尤其涉及一种视频生成方法、装置、电子设备和存储介质。
背景技术:
2.随着网络技术和移动终端技术的快速发展,出现了越来越多的应用程序。例如与图片编辑相关的应用程序,用户通过此类应用程序可以对图片进行编辑,其中包括生成与图片相关的视频。
3.目前,在对图片进行编辑以生成与图片相关的视频时,需要用户手动选择不同的音乐来控制视频或者说图片的播放节奏,存在用户操作繁琐,智能化程度较低的问题。
技术实现要素:
4.为了解决上述技术问题或者至少部分地解决上述技术问题,本公开实施例提供了一种视频生成方法、装置、电子设备和存储介质,达到了基于图片的内容个性化地为图片添加音乐,生成包括图片的目标视频的目的,从而使得生成的目标视频效果较好,同时简化用户基于图片生成视频的操作,提升视频生成效率和用户体验。
5.本公开实施例提供了一种视频生成方法,该方法包括:
6.确定目标图片的内容特征;
7.基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;
8.将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。
9.本公开实施例还提供了一种视频生成装置,该装置包括:
10.第一确定模块,用于确定目标图片的内容特征;
11.第二确定模块,用于基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;
12.处理模块,用于将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。
13.本公开实施例还提供了一种电子设备,所述电子设备包括:
14.一个或多个处理器;
15.存储装置,用于存储一个或多个程序;
16.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如上所述的视频生成方法。
17.本公开实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如上所述的视频生成方法。
18.本公开实施例提供的技术方案与现有技术相比至少具有如下优点:本公开实施例提供的视频生成方法,通过根据目标图片的内容特征确定节奏适配的目标音乐,将所述目
标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配,从而达到使目标视频的播放效果与目标图片的内容之间存在个性化关联关系的目的,进而提高基于目标图片生成的目标视频的播放效果,同时简化用户操作,提升用户的使用体验。
附图说明
19.结合附图并参考以下具体实施方式,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。贯穿附图中,相同或相似的附图标记表示相同或相似的元素。应当理解附图是示意性的,原件和元素不一定按照比例绘制。
20.图1为本公开实施例中的一种视频生成方法的流程图;
21.图2为本公开实施例中的一种视频轨道和音频轨道的示意图;
22.图3为本公开实施例中的一种视频轨道的示意图;
23.图4为本公开实施例中的一种音频轨道的示意图;
24.图5为本公开实施例中的一种视频轨道的示意图;
25.图6为本公开实施例中的一种音频轨道和视频轨道的示意图;
26.图7为本公开实施例中的一种视频生成方法的流程图;
27.图8为本公开实施例中的一种视频生成装置的结构示意图;
28.图9为本公开实施例中的一种电子设备的结构示意图。
具体实施方式
29.下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
30.应当理解,本公开的方法实施方式中记载的各个步骤可以按照不同的顺序执行,和/或并行执行。此外,方法实施方式可以包括附加的步骤和/或省略执行示出的步骤。本公开的范围在此方面不受限制。
31.本文使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”;术语“一些实施例”表示“至少一些实施例”。其他术语的相关定义将在下文描述中给出。
32.需要注意,本公开中提及的“第一”、“第二”等概念仅用于对不同的装置、模块或单元进行区分,并非用于限定这些装置、模块或单元所执行的功能的顺序或者相互依存关系。
33.需要注意,本公开中提及的“一个”、“多个”的修饰是示意性而非限制性的,本领域技术人员应当理解,除非在上下文另有明确指出,否则应该理解为“一个或多个”。
34.本公开实施方式中的多个装置之间所交互的消息或者信息的名称仅用于说明性的目的,而并不是用于对这些消息或信息的范围进行限制。
35.图1为本公开实施例中的一种视频生成方法的流程图,该方法可以由视频生成装置执行,该装置可以采用软件和/或硬件的方式实现,该装置可配置于电子设备中,例如终
端,具体包括但不限于智能手机、掌上电脑、平板电脑、带显示屏的可穿戴设备、台式机、笔记本电脑、一体机、智能家居设备等。
36.如图1所示,该方法具体包括如下步骤:
37.步骤110、确定目标图片的内容特征。
38.其中,目标图片可以是用户通过相机实时拍摄的图像素材,也可以是从终端本地导入的图像素材,还可以是从网络上下载的图像素材。
39.目标图片的内容特征可以包括目标图片的主色调、目标图片中的对象类别(例如人物或者风景)等以及对象的动作(例如跑、跳、睡觉、张嘴等)。
40.可选的,所述确定目标图片的内容特征,包括:
41.通过设定算法确定目标图片的画面特征;基于目标图片的画面特征确定目标图片的情绪特征;根据目标图片的情绪特征确定目标图片的内容特征。
42.其中,画面特征包括目标图片的色彩、目标图片中的对象类别(例如人物或者风景)以及目标图片中对象的动作中(例如跑、跳、睡觉、张嘴等)的至少一种。可选的,可以通过色彩识别算法识别目标图片的色彩;通过基于机器学习的神经网络模型对目标图片进行图像处理,识别目标图片中的对象类别以及对象的动作等。
43.目标图片的色彩具体指目标图片的主色调,例如红色、黄色、蓝色等。具体的可以通过统计每种颜色的像素点数量确定目标图片的主色调。例如目标图片包括红色和蓝色两种颜色,其中红色的像素点数量为1万个,蓝色的像素点数量为2万个,则可确定该目标图片的主色调为蓝色,即画面特征为蓝色。
44.进一步的,所述基于所述目标图片的画面特征确定所述目标图片的情绪特征,包括:
45.基于画面特征与情绪特征之间的预设映射关系,确定与目标图片的画面特征存在映射关系的情绪特征。
46.例如“红色”的画面特征与“浓烈豪放”的情绪特征存在映射关系;“黄色”的画面特征与“明亮轻快”的情绪特征存在映射关系;“蓝色”的画面特征与“温柔婉约”的情绪特征存在映射关系;“绿色”的画面特征与“冷静淡然”的情绪特征存在映射关系;“灰色”的画面特征与“阴暗低沉”的情绪特征存在映射关系。在确定目标图片的画面特征之后,基于上述预设映射关系即可确定与目标图片的画面特征存在映射关系的情绪特征。
47.或者,例如目标图片中对象的动作是“跳”的画面特征与“明亮轻快”的情绪特征存在映射关系;目标图片中对象的动作是“睡觉”的画面特征与“温柔婉约”的情绪特征存在映射关系等。
48.在一些实施例中,当目标图片的数量为一个时,根据所述目标图片的情绪特征确定所述目标图片的内容特征,包括:
49.将目标图片的情绪特征确定为目标图片的内容特征。
50.当目标图片的数量为两个时,所述根据所述目标图片的情绪特征确定所述目标图片的内容特征,包括:
51.若两个目标图片的情绪特征相同,则将目标图片的情绪特征确定为目标图片的内容特征;
52.若两个目标图片的情绪特征不相同,则将任一目标图片的情绪特征确定为目标图
片的内容特征。
53.当目标图片的数量为至少三个时,根据所述目标图片的情绪特征确定所述目标图片的内容特征,包括:
54.若各目标图片的情绪特征互不相同,则将任一目标图片的情绪特征确定为目标图片的内容特征。例如目标图片的数量为三个,分别记为第一目标图片、第二目标图片和第三目标图片。假设第一目标图片的情绪特征为“浓烈豪放”,第二目标图片的情绪特征为“明亮轻快”,第三目标图片的情绪特征为“温柔婉约”,则可以将“浓烈豪放”、“明亮轻快”以及“温柔婉约”中的任意一个确定为目标图片的内容特征,即目标图片的内容特征可以是“浓烈豪放”、“明亮轻快”或者“温柔婉约”。
55.当目标图片的数量为至少三个时,根据所述目标图片的情绪特征确定所述目标图片的内容特征,包括:
56.若存在不同目标图片的情绪特征相同的情况,则将出现次数最多的情绪特征确定为目标图片的内容特征。例如目标图片的数量为三个,分别记为第一目标图片、第二目标图片和第三目标图片。假设第一目标图片的情绪特征为“浓烈豪放”,第二目标图片的情绪特征为“浓烈豪放”,第三目标图片的情绪特征为“温柔婉约”,则将出现次数最多的“浓烈豪放”确定为目标图片的内容特征。再例如,目标图片的数量为6个,假设其中4个目标图片的情绪特征均为“温柔婉约”,则可确定出现次数最多的情绪特征为“温柔婉约”,即将“温柔婉约”确定为目标图片的内容特征。
57.概括性的,当目标图片的数量为多个时,每个目标图片分别对应有情绪特征,根据目标图片的情绪特征确定目标图片的内容特征,包括:选取对应目标图片数量最多的情绪特征作为内容特征。例如目标图片的数量为3个,分别标记为第一目标图片、第二目标图片和第三目标图片,其中,第一目标图片对应的情绪特征是a,第二目标图片对应的情绪特征是b,第三目标图片对应的情绪特征是a,即情绪特征a对应目标图片的数量为2,情绪特征b对应目标图片的数量为1,故将情绪特征a确定为内容特征。
58.步骤120、基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配。
59.可选的,目标音乐的节奏与内容特征相匹配,以通过目标音乐的节奏控制图片的轮播,控制目标图片的切换节奏。比如内容特征为“浓烈豪放”时,目标音乐可以是热情飞快的快节奏变化的音乐;内容特征为“阴暗低沉”时,目标音乐可以是缓慢节奏变化的音乐。
60.可选的,例如目标图片中包括人物,进一步的包括笑脸,则目标音乐可以是比较欢快的音乐;例如目标图片中包括情侣,则目标音乐可以是关于甜蜜情感的音乐等。
61.可选的,可预设内容特征与目标音乐之间的映射关系,当获得目标图片的内容特征之后,通过查找映射关系即可确定对应的目标音乐。
62.步骤130、将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。
63.其中,目标视频中的影像素材可以是目标图片,还可以是特效,例如快节奏的闪切特效,慢节奏的从模糊到清晰的转场特效等。
64.示例性的,将所述目标音乐与所述目标图片合成得到目标视频,包括:基于目标音乐的播放时长、目标图片的数量以及目标音乐的节奏中的至少一个确定各目标图片在目标
视频中的切换时刻;根据切换时刻生成目标视频。
65.可选的,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据目标图片的数量对目标音乐的播放时长进行均匀切分;将各切分点确定为目标图片在目标视频中的切换时刻,以使各目标图片在目标视频中的播放时长相同。
66.换言之,根据目标音乐的播放时长,匀速对各目标图片进行切换展示,例如目标音乐的播放时长为3s,目标图片的数量为三个,分别记为目标图片a、目标图片b和目标图片c,将目标音乐与目标图片合成得到目标视频,目标视频是包括目标图片a、目标图片b和目标图片c的一段时长为3s的视频。示例性的,参考如图2所示的一种视频轨道和音频轨道的示意图,其中,在目标视频的第0-1s播放目标图片a,即目标视频的第0-1s对应目标图片a的视频片段,当目标视频播放到第1s时,将视频画面由目标图片a切换为目标图片b;即在目标视频的第1-2s播放目标图片b,目标视频的第1-2s对应目标图片b的视频片段;当目标视频播放到第2s时,将视频画面由目标图片b切换为目标图片c,即在目标视频的第2-3s播放目标图片c,目标视频的第2-3s对应目标图片c的视频片段。即各目标图片在目标视频中的播放时长相同,即匀速播放各目标图片。示例性的,该目标音乐通常为比较柔和的慢节奏音乐
67.需要说明的是,目标图片a、目标图片b和目标图片c在目标视频中的播放顺序可以由用户预先指定,也可以随机确定,还可以基于一些策略动态化确定,例如按照各目标图片的拍摄时间确定播放顺序。
68.在一些实施例中,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:
69.根据各目标图片在目标视频中播放的预设时长,确定各目标图片在目标视频中的切换时刻,以使各目标图片在目标视频中的播放时长为预设时长。即根据各目标图片在目标视频中播放的预设时长,确定各目标图片在目标视频中的切换时刻,以使各目标图片在目标视频中的播放时长为预设时长。例如,预先指定每个目标图片在目标视频中的播放时长为1s,假设一共有5张目标图片,分别是目标图片a、目标图片b、目标图片c、目标图片d和目标图片e,示例性的如图3所示,在目标视频的第0-1s播放目标图片a,当目标视频播放到第1s时,将视频画面由目标图片a切换为目标图片b;在目标视频的第1-2s播放目标图片b,当目标视频播放到第2s时,将视频画面由目标图片b切换为目标图片c,在目标视频的第2-3s播放目标图片c,当目标视频播放到第3s时,将视频画面由目标图片c切换为目标图片d,在目标视频的第3-4s播放目标图片d,当目标视频播放到第4s时,将视频画面由目标图片d切换为目标图片e,在目标视频的第4-5s播放目标图片e。即目标视频的总时长为5s,若目标音乐的总时长大于5s,则播放到第5s时自动结束,若目标音乐的总时长不足5s,假设是3s,则播放到第3s时自动从头重复播放。
70.在一些实施例中,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据目标音乐的节奏确定目标音乐的重音节奏点;将重音节奏点确定为目标图片在目标视频中的切换时刻。即根据目标音乐的卡点时刻确定各目标图片在目标视频中的切换时刻,以使目标图片在目标视频中的切换时刻为卡点时刻。
71.例如目标音乐包括五个重音节奏点,即卡点时刻,分别是第1.5s、第2.3s、第3.0s、第3.9s和第4.4s,如图4所示的一种音频轨道的示意图。在基于目标图片(假设目标图片的数量为5)应用该目标音乐生成目标视频时,在目标视频的第0-1.5s的时间段内播放目标图片a,在第1.5s的时刻时将视频画面由目标图片a切换为目标图片b,在第1.5s-第2.3s的时间段内播放目标图片b,在第2.3s时将视频画面由目标图片b切换为目标图片c,在第2.3s-第3.0s的时间段内播放目标图片c,在第3.0s的时刻时将视频画面由目标图片c切换为目标图片d,在第3.0s-第3.9s的时间段内播放目标图片d,在第3.9s的时刻将视频画面由目标图片d切换为目标图片e,在第3.9s-第4.4s的时间段内播放目标图片e,当到达第4.4s时,目标视频播放结束。如图5所示的一种视频轨道的示意图。目标视频的播放状态从0s开始播放,同时读取对应时间线上的轨道信息,即图片+音乐,并且播放起止时刻以视频主轨道为主,因此播放到第4.4s时视频结束,整体呈现效果是卡点播放并且轻快节奏变化。该目标音乐通常是较快节奏的音乐。
72.进一步的,匀速播放控制视频节奏时,将目标音乐与目标图片合成得到目标视频,包括:假设目标图片的数量为5,目标音乐为一首12s长的慢节奏音乐,并且指定每张目标图片的播放时长为2s,则在视频播放器内部会生成一条新的音频轨道进行管理,与视频起始时刻保持一致,即从0s开始,播放到第10s结束,目标音乐也播放到第10s时结束,整体效果为匀速慢节奏播放。对应的可以参考如图6所示的一种音频轨道和视频轨道的示意图。
73.可选的,将所述目标音乐与所述目标图片合成得到目标视频,还包括:基于目标音乐的节奏确定目标视频中特效的切换时刻;根据所述目标图片在目标视频中的切换时刻以及特效的切换时刻生成目标视频。所述特效例如是快节奏的闪切特效,慢节奏的从模糊到清晰的转场特效等。
74.本公开实施例提供的视频生成方法,实现了根据目标图片的内容特征个性化地控制目标图片在目标视频中的播放节奏,使得目标视频的呈现效果更好,提高用户的使用体验。例如如果目标图片的内容特征是明亮欢快,则最终会生成节奏感较强的视频;如果目标图片的内容特征是阴暗低沉,则会生成节奏感缓慢的视频。从而使得目标视频的播放效果与目标图片的内容特征相关联,实现个性化目标视频的生成。
75.在上述实施例的基础上,参考如图7所示的一种视频生成方法的流程示意图,具体是基于目标图片确定内容特征,然后基于内容特征确定目标音乐,基于目标音乐控制视频的节奏变化,获得包括目标图片的目标视频。
76.图8为本公开实施例中的一种视频生成装置的结构示意图。该视频生成装置具体包括:第一确定模块810、第二确定模块820和处理模块830。
77.其中,第一确定模块810,用于确定目标图片的内容特征;第二确定模块820,用于基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;处理模块830,用于将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。
78.可选的,第一确定模块810包括:第一确定单元,用于通过设定算法确定所述目标图片的画面特征;第二确定单元,用于基于所述目标图片的画面特征确定所述目标图片的情绪特征;第三确定单元,用于根据所述目标图片的情绪特征确定所述目标图片的内容特征。
79.可选的,所述第二确定单元具体用于:基于画面特征与情绪特征之间的预设映射关系,确定与所述目标图片的画面特征存在映射关系的情绪特征。
80.可选的,所述画面特征包括目标图片的色彩、目标图片中的对象类别以及目标图片中对象的动作中的至少一种。
81.可选的,当所述目标图片的数量为多个时,每个目标图片分别对应有情绪特征,所述第三确定单元具体用于:选取对应目标图片数量最多的情绪特征作为所述内容特征。
82.可选的,处理模块830包括:确定单元,用于基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻;生成单元,用于根据所述切换时刻生成所述目标视频。
83.可选的,所述确定单元具体用于:根据所述目标图片的数量对所述目标音乐的播放时长进行均匀切分;将各切分点确定为所述目标图片在所述目标视频中的切换时刻,以使各所述目标图片在所述目标视频中的播放时长相同。
84.可选的,所述确定单元具体用于:根据各所述目标图片在所述目标视频中播放的预设时长,确定各所述目标图片在所述目标视频中的切换时刻,以使各所述目标图片在所述目标视频中的播放时长为预设时长。
85.可选的,所述确定单元具体用于:根据所述目标音乐的节奏确定所述目标音乐的重音节奏点;将所述重音节奏点确定为所述目标图片在所述目标视频中的切换时刻。
86.可选的,所述确定单元还用于:基于所述目标音乐的节奏确定所述目标视频中特效的切换时刻;所述生成单元用于:根据所述目标图片在所述目标视频中的切换时刻以及所述特效的切换时刻生成所述目标视频。
87.本公开实施例提供的视频生成装置,可执行本公开方法实施例所提供的方法中的步骤,具备执行步骤和有益效果此处不再赘述。
88.图9为本公开实施例中的一种电子设备的结构示意图。下面具体参考图9,其示出了适于用来实现本公开实施例中的电子设备500的结构示意图。本公开实施例中的电子设备500可以包括但不限于诸如移动电话、笔记本电脑、数字广播接收器、pda(个人数字助理)、pad(平板电脑)、pmp(便携式多媒体播放器)、车载终端(例如车载导航终端)、可穿戴电子设备等等的移动终端以及诸如数字tv、台式计算机、智能家居设备等等的固定终端。图9示出的电子设备仅仅是一个示例,不应对本公开实施例的功能和使用范围带来任何限制。
89.如图9所示,电子设备500可以包括处理装置(例如中央处理器、图形处理器等)501,其可以根据存储在只读存储器(rom)502中的程序或者从存储装置508加载到随机访问存储器(ram)503中的程序而执行各种适当的动作和处理以实现如本公开所述的实施例的视频生成方法。在ram 503中,还存储有电子设备500操作所需的各种程序和数据。处理装置501、rom 502以及ram 503通过总线504彼此相连。输入/输出(i/o)接口505也连接至总线504。
90.通常,以下装置可以连接至i/o接口505:包括例如触摸屏、触摸板、键盘、鼠标、摄像头、麦克风、加速度计、陀螺仪等的输入装置506;包括例如液晶显示器(lcd)、扬声器、振动器等的输出装置507;包括例如磁带、硬盘等的存储装置508;以及通信装置509。通信装置509可以允许电子设备500与其他设备进行无线或有线通信以交换数据。虽然图9示出了具有各种装置的电子设备500,但是应理解的是,并不要求实施或具备所有示出的装置。可以
替代地实施或具备更多或更少的装置。
91.特别地,根据本公开的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本公开的实施例包括一种计算机程序产品,其包括承载在非暂态计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的程序代码,从而实现如上所述的视频生成方法。在这样的实施例中,该计算机程序可以通过通信装置509从网络上被下载和安装,或者从存储装置508被安装,或者从rom 502被安装。在该计算机程序被处理装置501执行时,执行本公开实施例的方法中限定的上述功能。
92.需要说明的是,本公开上述的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(ram)、只读存储器(rom)、可擦式可编程只读存储器(eprom或闪存)、光纤、便携式紧凑磁盘只读存储器(cd-rom)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本公开中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本公开中,计算机可读信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的程序代码。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读信号介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的程序代码可以用任何适当的介质传输,包括但不限于:电线、光缆、rf(射频)等等,或者上述的任意合适的组合。
93.在一些实施方式中,客户端、服务器可以利用诸如http(hypertext transfer protocol,超文本传输协议)之类的任何当前已知或未来研发的网络协议进行通信,并且可以与任意形式或介质的数字数据通信(例如,通信网络)互连。通信网络的示例包括局域网(“lan”),广域网(“wan”),网际网(例如,互联网)以及端对端网络(例如,ad hoc端对端网络),以及任何当前已知或未来研发的网络。
94.上述计算机可读介质可以是上述电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。
95.上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被该电子设备执行时,使得该电子设备:确定目标图片的内容特征;基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。
96.可选的,当上述一个或者多个程序被该电子设备执行时,该电子设备还可以执行上述实施例所述的其他步骤。
97.可以以一种或多种程序设计语言或其组合来编写用于执行本公开的操作的计算机程序代码,上述程序设计语言包括但不限于面向对象的程序设计语言—诸如java、smalltalk、c++,还包括常规的过程式程序设计语言—诸如“c”语言或类似的程序设计语言。程序代码可以完全地在用户计算机上执行、部分地在用户计算机上执行、作为一个独立
的软件包执行、部分在用户计算机上部分在远程计算机上执行、或者完全在远程计算机或服务器上执行。在涉及远程计算机的情形中,远程计算机可以通过任意种类的网络——包括局域网(lan)或广域网(wan)—连接到用户计算机,或者,可以连接到外部计算机(例如利用因特网服务提供商来通过因特网连接)。
98.附图中的流程图和框图,图示了按照本公开各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。在这点上,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,该模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图和/或流程图中的每个方框、以及框图和/或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
99.描述于本公开实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现。其中,单元的名称在某种情况下并不构成对该单元本身的限定。
100.本文中以上描述的功能可以至少部分地由一个或多个硬件逻辑部件来执行。例如,非限制性地,可以使用的示范类型的硬件逻辑部件包括:现场可编程门阵列(fpga)、专用集成电路(asic)、专用标准产品(assp)、片上系统(soc)、复杂可编程逻辑设备(cpld)等等。
101.在本公开的上下文中,机器可读介质可以是有形的介质,其可以包含或存储以供指令执行系统、装置或设备使用或与指令执行系统、装置或设备结合地使用的程序。机器可读介质可以是机器可读信号介质或机器可读储存介质。机器可读介质可以包括但不限于电子的、磁性的、光学的、电磁的、红外的、或半导体系统、装置或设备,或者上述内容的任何合适组合。机器可读存储介质的更具体示例会包括基于一个或多个线的电气连接、便携式计算机盘、硬盘、随机存取存储器(ram)、只读存储器(rom)、可擦除可编程只读存储器(eprom或快闪存储器)、光纤、便捷式紧凑盘只读存储器(cd-rom)、光学储存设备、磁储存设备、或上述内容的任何合适组合。
102.根据本公开的一个或多个实施例,本公开提供了一种视频生成方法,包括:确定目标图片的内容特征;基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。
103.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述确定目标图片的内容特征,包括:通过设定算法确定所述目标图片的画面特征;基于所述目标图片的画面特征确定所述目标图片的情绪特征;根据所述目标图片的情绪特征确定所述目标图片的内容特征。
104.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述基于所述目标图片的画面特征确定所述目标图片的情绪特征,包括:基于画面特征与情绪特征之间的预设映射关系,确定与所述目标图片的画面特征存在映射关系的情绪特征。
105.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述
画面特征包括目标图片的色彩、目标图片中的对象类别以及目标图片中对象的动作中的至少一种。
106.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,当所述目标图片的数量为多个时,每个目标图片分别对应有情绪特征,所述根据所述目标图片的情绪特征确定所述目标图片的内容特征,包括:选取对应目标图片数量最多的情绪特征作为所述内容特征。
107.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述将所述目标音乐与所述目标图片合成得到目标视频,包括:基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻;根据所述切换时刻生成所述目标视频。
108.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据所述目标图片的数量对所述目标音乐的播放时长进行均匀切分;将各切分点确定为所述目标图片在所述目标视频中的切换时刻,以使各所述目标图片在所述目标视频中的播放时长相同。
109.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据各所述目标图片在所述目标视频中播放的预设时长,确定各所述目标图片在所述目标视频中的切换时刻,以使各所述目标图片在所述目标视频中的播放时长为预设时长。
110.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据所述目标音乐的节奏确定所述目标音乐的重音节奏点;将所述重音节奏点确定为所述目标图片在所述目标视频中的切换时刻。
111.根据本公开的一个或多个实施例,在本公开提供的视频生成方法中,可选的,所述将所述目标音乐与所述目标图片合成得到目标视频,还包括:基于所述目标音乐的节奏确定所述目标视频中特效的切换时刻;所述根据所述切换时刻生成所述目标视频,包括:根据所述目标图片在所述目标视频中的切换时刻以及所述特效的切换时刻生成所述目标视频。
112.根据本公开的一个或多个实施例,本公开提供了一种视频生成装置,包括:第一确定模块,用于确定目标图片的内容特征;第二确定模块,用于基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;处理模块,用于将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。
113.根据本公开的一个或多个实施例,本公开提供了一种电子设备,包括:
114.一个或多个处理器;
115.存储器,用于存储一个或多个程序;
116.当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如本公开提供的任一所述的视频生成方法。
117.根据本公开的一个或多个实施例,本公开提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现如本公开提供的任一所述的视频生成方法。
118.以上描述仅为本公开的较佳实施例以及对所运用技术原理的说明。本领域技术人员应当理解,本公开中所涉及的公开范围,并不限于上述技术特征的特定组合而成的技术方案,同时也应涵盖在不脱离上述公开构思的情况下,由上述技术特征或其等同特征进行任意组合而形成的其它技术方案。例如上述特征与本公开中公开的(但不限于)具有类似功能的技术特征进行互相替换而形成的技术方案。
119.此外,虽然采用特定次序描绘了各操作,但是这不应当理解为要求这些操作以所示出的特定次序或以顺序次序执行来执行。在一定环境下,多任务和并行处理可能是有利的。同样地,虽然在上面论述中包含了若干具体实现细节,但是这些不应当被解释为对本公开的范围的限制。在单独的实施例的上下文中描述的某些特征还可以组合地实现在单个实施例中。相反地,在单个实施例的上下文中描述的各种特征也可以单独地或以任何合适的子组合的方式实现在多个实施例中。
120.尽管已经采用特定于结构特征和/或方法逻辑动作的语言描述了本主题,但是应当理解所附权利要求书中所限定的主题未必局限于上面描述的特定特征或动作。相反,上面所描述的特定特征和动作仅仅是实现权利要求书的示例形式。
技术特征:
1.一种视频生成方法,其特征在于,所述方法包括:确定目标图片的内容特征;基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。2.根据权利要求1所述的方法,其特征在于,所述确定目标图片的内容特征,包括:通过设定算法确定所述目标图片的画面特征;基于所述目标图片的画面特征确定所述目标图片的情绪特征;根据所述目标图片的情绪特征确定所述目标图片的内容特征。3.根据权利要求2所述的方法,其特征在于,所述画面特征包括目标图片的色彩、目标图片中的对象类别以及目标图片中对象的动作中的至少一种。4.根据权利要求2所述的方法,其特征在于,所述基于所述目标图片的画面特征确定所述目标图片的情绪特征,包括:基于画面特征与情绪特征之间的预设映射关系,确定与所述目标图片的画面特征存在映射关系的情绪特征。5.根据权利要求2所述的方法,其特征在于,当所述目标图片的数量为多个时,每个目标图片分别对应有情绪特征,所述根据所述目标图片的情绪特征确定所述目标图片的内容特征,包括:选取对应目标图片数量最多的情绪特征作为所述内容特征。6.根据权利要求1所述的方法,其特征在于,所述将所述目标音乐与所述目标图片合成得到目标视频,包括:基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻;根据所述切换时刻生成所述目标视频。7.根据权利要求6所述的方法,其特征在于,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据所述目标图片的数量对所述目标音乐的播放时长进行均匀切分;将各切分点确定为所述目标图片在所述目标视频中的切换时刻,以使各所述目标图片在所述目标视频中的播放时长相同。8.根据权利要求6所述的方法,其特征在于,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据各所述目标图片在所述目标视频中播放的预设时长,确定各所述目标图片在所述目标视频中的切换时刻,以使各所述目标图片在所述目标视频中的播放时长为预设时长。9.根据权利要求6所述的方法,其特征在于,所述基于所述目标音乐的播放时长、所述目标图片的数量以及所述目标音乐的节奏中的至少一个确定各所述目标图片在所述目标视频中的切换时刻,包括:根据所述目标音乐的节奏确定所述目标音乐的重音节奏点;
将所述重音节奏点确定为所述目标图片在所述目标视频中的切换时刻。10.根据权利要求6所述的方法,其特征在于,所述将所述目标音乐与所述目标图片合成得到目标视频,还包括:基于所述目标音乐的节奏确定所述目标视频中特效的切换时刻;所述根据所述切换时刻生成所述目标视频,包括:根据所述目标图片在所述目标视频中的切换时刻以及所述特效的切换时刻生成所述目标视频。11.一种视频生成装置,其特征在于,包括:第一确定模块,用于确定目标图片的内容特征;第二确定模块,用于基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;处理模块,用于将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。12.一种电子设备,其特征在于,所述电子设备包括:一个或多个处理器;存储装置,用于存储一个或多个程序;当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现如权利要求1-10中任一项所述的方法。13.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该程序被处理器执行时实现如权利要求1-10中任一项所述的方法。
技术总结
本公开实施例公开了一种视频生成方法、装置、电子设备和存储介质,该方法包括:确定目标图片的内容特征;基于所述内容特征确定目标音乐,所述目标音乐的节奏与所述内容特征相匹配;将所述目标音乐与所述目标图片合成得到目标视频,所述目标视频中影像素材的切换节奏与所述目标音乐的节奏相匹配。本公开达到了基于图片的内容个性化地为图片添加目标音乐,生成包括图片的目标视频的目的,从而使得生成的目标视频效果较好,同时简化用户基于图片生成视频的操作,提升视频生成效率和用户体验。提升视频生成效率和用户体验。提升视频生成效率和用户体验。
技术研发人员:祝希闽 蔡官明 张兴华
受保护的技术使用者:北京字跳网络技术有限公司
技术研发日:2022.03.18
技术公布日:2023/9/22
版权声明
本文仅代表作者观点,不代表航家之家立场。
本文系作者授权航家号发表,未经原创作者书面授权,任何单位或个人不得引用、复制、转载、摘编、链接或以其他任何方式复制发表。任何单位或个人在获得书面授权使用航空之家内容时,须注明作者及来源 “航空之家”。如非法使用航空之家的部分或全部内容的,航空之家将依法追究其法律责任。(航空之家官方QQ:2926969996)
航空之家 https://www.aerohome.com.cn/
航空商城 https://mall.aerohome.com.cn/
航空资讯 https://news.aerohome.com.cn/