1.视听模态的融合 视频描述生成在很多领域中有着潜在应用,比如人机交互、盲人辅助和视频检索。近些年来,受益于卷积神经网络CNN,递归神经网络和大规模的视频描述数据集,视频描述生成已经取得比较理想的结果。 大多数视频描述生成框架可以分为一个编码器和一个解码器,编码器对视频特征进行编码形成一个固定长度的视频特征向量,解码器基于该视频特征生成对应的视频描述子。...
MOD ITU-R BS.1770-4:2015|信息来源 工业和信息化部官网 |声明:本文所用视频、图片、文字部分来源于互联网,版权属原作者所有。如涉及到版权问题,请及时和我们联系,核实后按国家标准支付稿酬或作删除处理。...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号