信息技术.视听对象的编码.第29部分:网络视频编码 是非强制性国家标准,您可以免费下载预览页
大部分传统的视频描述生成方法只关注视觉信息而忽略声音信息,可能会产生语义不完整的句子:“一个人躺在床上”。如果可以将音频信息结合到模型中,就可以产生语义完整的句子“一个人躺在床上唱歌”。 那么如何更合理地利用视听觉信息?...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved 京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号