非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 ISO/IEC 14496-23:2008 前三页,或者稍后再访问。
您也可以尝试购买此标准,
点击右侧 “购买” 按钮开始采购(由第三方提供)。
点击下载后,生成下载文件时间比较长,请耐心等待......
研究人员将视频帧表示为xi=V(fi),其中fi为第i帧,V(.)是提取VGG19网络中FC6特征的操作,它已经在ImageNet上进行过预训练,xi是一个4096维向量。在序列到序列的模型中,视频编码器和声音生成器明显是分开的,并通过一个bottleneck来表示连接,它将编码的可视信息提供给声音生成器。如上图中红色框的(c)区所示,研究人员建立了一个递归神经网络来编码视频特征。...
文本中的标点也需要进行预处理,机器可以通过标点符号获得句子表达的语气。完成预处理环节后,我们就可以拿到文本中的语言特征的特征向量。第二步,将特征向量输入到基于深度学习模型的编码器中,对特征向量进行提取和编码,就可以得到隐藏层的特征信息;将隐藏层的特征信息再输入到解码器,就可以得到语音特征的表示,即生成的频谱图。第三步,将频谱图输入声码器,输出对应文本的Waveform声波。...
GB/T 14808-2001 2017-03-01 49 GB/T 14849.10-2016 工业硅化学分析方法 第10部分:汞含量的测定 原子荧光光谱法 2017-07-01 50 GB/T 14849.11-2016 工业硅化学分析方法 第11部分:铬含量的测定 二苯碳酰二肼分光光度法 2017-07-01 51 GB/T 15185-2016 法兰连接铁制和铜制球阀 部分代替...
Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号