T/BDAEA 003-2023 多模态人机交互技术要求标准

非常抱歉，我们暂时无法提供预览，您可以试试：免费下载 T/BDAEA 003-2023 前三页，或者稍后再访问。

您也可以尝试购买此标准，
点击右侧 “立即购买” 按钮开始采购（由第三方提供）。

标准号: T/BDAEA 003-2023
发布: 2023年
发布单位: 中国团体标准
当前最新: T/BDAEA 003-2023

适用范围: 本文件规定了多模态人机交互技术在环境中的术语、定义、测试方法，测试标准及技术要求，确保交互系统的易用性、可靠性和互操作性，为用户提供更智能、便利和舒适的出行环境。本部分适用于在地铁、商场、银行、地下停车场等内的多模态人机交互场景。 5.4.1　技术要求 (1)　具备关键词语音识别能力，在低噪环境(噪声强度在 50 dB 以下)中,关键词语音识别的字正确率应在90%以上;在高噪环境(噪声强度在 60 dB~65 dB)中,关键词语音识别的字正确率宜在85%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词，并根据关键词提供具体服务。 (2)　具备连续语音识别能力。在低噪环境(声强度在 50 dB 以下)中连续语音识别的字正确率宜在85%以上:在高噪环境(噪声强度在 60 dB~65 dB)中,连续语音识别的字正确率官在80%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词，并根据关键词提供具体服务。 (3)　智能客服语音交互系统数字语音识别要求包括:应支持数字识别及服务,宜支持不同数字表达方式的识别示例并且正确率应在99%以上。 5.5　声源定位 5.5.1　技术要求 (1)　定位准确度：最大角度误差：定位结果与实际声源位置之间的最大角度误差不得超过±5°。 (2)　最大空间距离误差：定位结果与实际声源位置之间的最大空间距离误差不得超过0.5米。 (3)　动态响应：系统应在声源位置变化后的1000毫秒内，完成声源定位并输出结果。 (4)　实时性：系统的声源定位响应延迟应不超过500毫秒。 5.5.2　测试要求 (1)　时间差法测试：使用多个微型麦克风阵列，同时记录声源信号到达每个麦克风的时间，通过计算时间差来确定声源方向。 (2)　幅度差法测试：使用多个微型麦克风阵列，同时记录声源信号到达每个麦克风的幅度差，通过计算幅度差来确定声源方向。 (3)　波束形成测试：使用波束形成算法和多个麦克风，测试算法对声源定位的准确性和鲁棒性。 (4)　声源跟踪测试：测试声源定位系统对运动声源的跟踪能力，包括声源的速度和加速度变化等。

T/BDAEA 003-2023
多模态人机交互技术要求

Technical requirements for multimodal human-machine interaction

T/BDAEA 003-2023相似标准

推荐

多模态自然人机交互神经系统疾病辅助诊断工具

上科大智能感知与人机协同教育部重点实验室获批

T/BDAEA 003-2023多模态人机交互技术要求

Technical requirements for multimodal human-machine interaction

T/BDAEA 003-2023相似标准

推荐

多模态自然人机交互神经系统疾病辅助诊断工具

上科大智能感知与人机协同教育部重点实验室获批

T/BDAEA 003-2023
多模态人机交互技术要求