ISO/IEC 14496-3:2001/Amd 2:2004
信息技术.视听对象的编码.第3部分:音频.修改件2:高质量音频的参数编码

Information technology — Coding of audio-visual objects — Part 3: Audio — Amendment 2: Parametric coding for high-quality audio


 

 

非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 ISO/IEC 14496-3:2001/Amd 2:2004 前三页,或者稍后再访问。

您也可以尝试购买此标准,
点击右侧 “立即购买” 按钮开始采购(由第三方提供)。

 

标准号
ISO/IEC 14496-3:2001/Amd 2:2004
发布
2004年
发布单位
国际标准化组织
替代标准
ISO/IEC 14496-3:2005
当前最新
ISO/IEC 14496-3:2019
 
 

ISO/IEC 14496-3:2001/Amd 2:2004相似标准


推荐

标准 | 7项行业标准和3项国家标准正在报批公示

3. SJ/T 11180.2-2019音频视听设备 数字音频部分 音频特性基本测量方法 2部分:消费级应用本标准规定了消费级应用音频视听设备数字音频特性基本测量方法。数字音频特性通用测量条件和测量方法见SJ/T 11180.1《音频视听设备 数字音频部分 音频特性基本测量方法 1部分:总则》。IDT IEC 61606-2:20094. ...

类脑信息处理研究取得进展

听觉推理模型具体为将视觉特征输入编码器进行编码,利用解码器解码出对应听觉特征,通过在生成听觉特征与真实听觉特征之间增加L2范数约束来更新该模型参数,并实现视觉特征到听觉特征准确映射。模型在MSR-VTT、MSVD数据集上取得了理想效果。  2.视听模态生成  视听模态是视频中两个共生模态,包含相同和互补信息。利用共同信息可实现模态间相互转换。同时,互补信息可作为先验去辅助相关工作。...

骗过70%的人!这个AI能自动给视频配音,真假难辨(不服来试)

SampleRNN模型简化结构如下图所示。△ 声音生成器简化架构图中将示例结构简化到2层,但在实际操作中可能包含更多层次。该模型由多个层、细层(底层)是一个多层感知器(MLP),它从下一个粗层(上层)和前一个k样本中输出,生成一个新样本。3编码视觉信息和系统变体之后,研究人员提出了三种类型编码器-解码器结构,这些信息可以与声音生成网络相结合,形成一个完整框架。...

使用英伟达NeMo让你文字会说话,零基础即可实现自然语音生成任务 | 附代码

接下来,我们一起进入代码实战部分,去实际体验如何在NeMo中快速调用这些模型,让我们文字会说话(代码实战部分见直播回放33分钟起)。...





Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号