ISO/IEC 14496-19:2004
信息技术.音频-可视对象的编码.第19部分:合成结构流

Information technology - Coding of audio-visual objects - Part 19: Synthesized texture stream

信息技术.音频-可视对象的编码.第19部分:合成结构流 是非强制性国家标准，您可以免费下载预览页

预览 ISO/IEC 14496-19:2004前三页

标准号: ISO/IEC 14496-19:2004
发布: 2004年
发布单位: 国际标准化组织
当前最新: ISO/IEC 14496-19:2004

适用范围: ISO/IEC 14496 的这一部分指定了作为 MPEG-4 编码视听呈现的一部分的合成纹理数据的传输功能。更具体地说，它定义： 1. 用于合成纹理数据编码的合成纹理格式表示 2. 合成纹理数据流的编码表示。

推荐

骗过70%的人！这个AI能自动给视频配音，真假难辨（不服来试）

研究人员将视频帧表示为xi=V(fi)，其中fi为第i帧，V(.)是提取VGG19网络中FC6特征的操作，它已经在ImageNet上进行过预训练，xi是一个4096维向量。在序列到序列的模型中，视频编码器和声音生成器明显是分开的，并通过一个bottleneck来表示连接，它将编码的可视信息提供给声音生成器。如上图中红色框的(c)区所示，研究人员建立了一个递归神经网络来编码视频特征。...

Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号京公网安备1101085018 电信与信息服务业务经营许可证：京ICP证110310号