咨询电话:13280638997
传真:0533-3110363
邮箱:kefu@shizifang.com
摘 要:本申请公开了一种视频生成模型的构建和视频生成方法、装置、设备及介质,涉及计算机技术领域,尤其涉及深度学习、计算机视觉和语音技术等人工智能技术领域。具体实现方案为:将样本人物图像和样本语音片段输入初始模型的编码器网络,得到图像特征和语音动作关联特征,将图像特征和语音动作关联特征输入初始模型的解码器网络,预测样本语音片段驱动样本人物图像的人物图像序列,并将语音动作关联特征输入初始模型的音素预测网络,预测样本语音片段的音素信息;根据样本语音片段的音素标签、样本语音片段关联的样本视频帧序列、音素信息和人物图像序列,对初始模型进行训练,得到视频生成模型。为图像驱动技术的发展提供了一种新思路。
著 录 项:
专利/申请号: | CN202110088850.1 | 专利名称: | 视频生成模型的构建和视频生成方法、装置、设备及介质 |
申请日: | 2021-01-22 | 申请/专利权人 | 北京百度网讯科技有限公司 |
专利类型: | 发明 | 地址: | 北京市海淀区上地十街10号百度大厦2层 |
专利状态: | 已下证 查询审查信息 | 分类号: | H04N21/44搜分类 音视频搜索 |
公开/公告日: | 转让价格: | 面议 | |
公开/公告号: | 交易状态: | 等待洽谈 搜索相似专利 |
交易方 | 企业 | 个人 |
买家 | 营业执照副本复印件(需盖公章) | 身份证复印件(签字) |
专利转让委托书(需盖公章)一式两份 | 专利转让委托书(需签字)一式两份 | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
卖家 | 营业执照副本复印件(需盖公章) | 身份证复印件(需申请人签字) |
解除代理委托书(需盖公章)一式两份(如专利通过代理机构申请) | 解除代理委托书(需签字)一式两份(如专利通过代理机构申请) | |
专利转让协议(需盖公章)一式两份 | 专利转让协议(需签字)一式两份 | |
专利请求书或手续合格通知书、授权通知书复印件 | 专利请求书或手续合格通知书、专利授权通知书复印件 | |
专利证原件(若授权下证) | 专利证原件(若授权下证) |
日期 | 法律信息 | 备注 |
2023/02/21 | 授权 | |
2021/06/18 | 实质审查的生效 | IPC(主分类): H04N 21/44 专利申请号: 202110088850.1 申请日: 2021.01.22 |
2021/06/01 | 公开 |