ISO/IEC 14496-3:2001/Amd 2:2004
信息技术.视听对象的编码.第3部分:音频.修改件2:高质量音频的参数编码

Information technology — Coding of audio-visual objects — Part 3: Audio — Amendment 2: Parametric coding for high-quality audio

被代替

信息技术.视听对象的编码.第3部分:音频.修改件2:高质量音频的参数编码, 您可以免费下载预览页

非常抱歉，我们暂时无法提供预览，您可以试试：免费下载 ISO/IEC 14496-3:2001/Amd 2:2004 前三页，或者稍后再访问。

您也可以尝试购买此标准，
点击右侧 “立即购买” 按钮开始采购（由第三方提供）。

标准号: ISO/IEC 14496-3:2001/Amd 2:2004
发布: 2004年
发布单位: 国际标准化组织
替代标准: ISO/IEC 14496-3:2005
当前最新: ISO/IEC 14496-3:2019

ISO/IEC 14496-3:2001/Amd 2:2004相似标准

ISO/IEC 14496-3:2001/Amd 2:2004/Cor 1:2005 信息技术.音频-可视对象的编码.第3部分:音频.修改件2:高质量音频的参量编码 ISO/IEC 14496-3:1999/Amd 1:2000 信息技术.视听对象的编码.第3部分:音频.修改件1:音频扩展 ISO/IEC 14496-3:2009/AMD3:2012 修改件3-信息技术视听对象编码第3部分:音频统一语音和音频编码的传输（USAC） ISO/IEC 14496-3:2005/Amd 2:2006 信息技术.视听对象的编码.第3部分:音频.修改件2:音频无损编码（ALS）新音频文件和BSAC扩展 ISO/IEC 14496-3:2001/Amd 6:2005 信息技术.视听对象的编码.第3部分:音频.修改件6:过度抽样音频的损失编码

推荐

标准 | 7项行业标准和3项国家标准正在报批公示

3. SJ/T 11180.2-2019音频和视听设备数字音频部分音频特性基本测量方法第2部分:消费级应用本标准规定了消费级应用的音频和视听设备的数字音频特性的基本测量方法。数字音频特性的通用测量条件和测量方法见SJ/T 11180.1《音频和视听设备数字音频部分音频特性基本测量方法第1部分：总则》。IDT IEC 61606-2:20094. ...

听觉推理模型具体为将视觉特征输入编码器进行编码，利用解码器解码出对应的听觉特征，通过在生成的听觉特征与真实的听觉特征之间增加L2范数约束来更新该模型参数，并实现视觉特征到听觉特征的准确映射。模型在MSR-VTT、MSVD数据集上取得了理想的效果。　　2.视听模态的生成　　视听模态是视频中的两个共生模态，包含相同和互补信息。利用共同信息可实现模态间的相互转换。同时，互补信息可作为先验去辅助相关工作。...

骗过70%的人！这个AI能自动给视频配音，真假难辨（不服来试）

SampleRNN模型的简化结构如下图所示。△ 声音生成器的简化架构图中将示例结构简化到2层，但在实际操作中可能包含更多层次。该模型由多个层、细层（底层）是一个多层感知器（MLP），它从下一个粗层（上层）和前一个k样本中输出，生成一个新样本。3种编码视觉信息和系统的变体之后，研究人员提出了三种类型的编码器-解码器结构，这些信息可以与声音生成网络相结合，形成一个完整的框架。...

使用英伟达NeMo让你的文字会说话，零基础即可实现自然语音生成任务 | 附代码

接下来，我们一起进入代码实战的部分，去实际体验如何在NeMo中快速调用这些模型，让我们的文字会说话（代码实战部分见直播回放第33分钟起）。...

ISO/IEC 14496-3:2001/Amd 2:2004信息技术.视听对象的编码.第3部分:音频.修改件2:高质量音频的参数编码