非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 ITU-T H.222.0-2017 前三页,或者稍后再访问。
您也可以尝试购买此标准,
点击右侧 “购买” 按钮开始采购(由第三方提供)。
点击下载后,生成下载文件时间比较长,请耐心等待......
研究者们针对定长的视频特征描述子提出了一些方法,比如对视频帧进行池化操作,下采样固定长度的视频帧,在递归网络视频特征编码阶段提取最后一个时刻的状态表示。 虽然上述方法均可生成比较合理的视频描述,但是这些模型的视频特征编码都只侧重于视觉信息而忽略了音频信息。该课题组认为,忽视声音模态会损害模型性能。比如,一个人躺在床上唱歌。...
SampleRNN模型的简化结构如下图所示。△ 声音生成器的简化架构图中将示例结构简化到2层,但在实际操作中可能包含更多层次。该模型由多个层、细层(底层)是一个多层感知器(MLP),它从下一个粗层(上层)和前一个k样本中输出,生成一个新样本。3种编码视觉信息和系统的变体之后,研究人员提出了三种类型的编码器-解码器结构,这些信息可以与声音生成网络相结合,形成一个完整的框架。...
尽管存在加工和集成难度大等问题,但太赫兹雷达尺寸小尤其适合于阵列化,在阵列成像领域具有很大的应用潜力。德国法兰克福大学与丹麦科技大学合作基于8发16收线阵雷达提出了双站快速因子分解后向投影算法进行图像重建,在2 ms内可以完成像素大小为128×128的图像聚焦[25]。美国JPL实验室8阵元集成收发阵列也已应用于安检成像系统以实现视频帧速的成像[23]。...
图像与视频的深度伪造检测技术主要可以分为针对伪造痕迹进行取证的检测方法和数据驱动的检测方法。针对伪造痕迹进行取证可以采取直接对图像进行检测的方法,主要检测“图像处理取证,生物信息,融合痕迹,时序连贯和模型指纹”等图像伪造痕迹。除了直接针对检测图像进行图像取证的方法,部分研究者针对深度伪造步骤中将生成模型输出结果和外围背景的融合步骤产生的伪造痕迹进行检测。...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号