大部分传统的视频描述生成方法只关注视觉信息而忽略声音信息,可能会产生语义不完整的句子:“一个人躺在床上”。如果可以将音频信息结合到模型中,就可以产生语义完整的句子“一个人躺在床上唱歌”。 那么如何更合理地利用视听觉信息?...
截至2008年6月,国家广电总局已颁布7项移动多媒体广播电视行业标准,分别为: (1)GY/T 220.1-2006 移动多媒体广播 第1部分:广播信道帧结构、信道编码和调制 (2)GY/T 220.2-2006 移动多媒体广播 第2部分:复用 (3)GY/T 220.3-2007 移动多媒体广播 第3部分:电子业务指南 (4)GY/T 220.4-2007 移动多媒体广播 第4部分...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号