T/BDAEA 003-2023
多模态人机交互技术要求

Technical requirements for multimodal human-machine interaction


 

 

非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 T/BDAEA 003-2023 前三页,或者稍后再访问。

您也可以尝试购买此标准,
点击右侧 “立即购买” 按钮开始采购(由第三方提供)。

 

标准号
T/BDAEA 003-2023
发布
2023年
发布单位
中国团体标准
当前最新
T/BDAEA 003-2023
 
 
适用范围
本文件规定了多模态人机交互技术在环境中的术语、定义、测试方法,测试标准及技术要求,确保交互系统的易用性、可靠性和互操作性,为用户提供更智能、便利和舒适的出行环境。 本部分适用于在地铁、商场、银行、地下停车场等内的多模态人机交互场景。 5.4.1 技术要求 (1) 具备关键词语音识别能力,在低噪环境(噪声强度在 50 dB 以下)中,关键词语音识别的字正确率应在90%以上;在高噪环境(噪声强度在 60 dB~65 dB)中,关键词语音识别的字正确率宜在85%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词,并根据关键词提供具体服务。 (2) 具备连续语音识别能力。在低噪环境(声强度在 50 dB 以下)中连续语音识别的字正确率宜在85%以上:在高噪环境(噪声强度在 60 dB~65 dB)中,连续语音识别的字正确率官在80%以上。字正确率的性能指标定义见 GB/T 21023-2007 的仅能识别关键词,并根据关键词提供具体服务。 (3) 智能客服语音交互系统数字语音识别要求包括:应支持数字识别及服务,宜支持不同数字表达方式的识别示例并且正确率应在99%以上。 5.5 声源定位 5.5.1 技术要求 (1) 定位准确度: 最大角度误差:定位结果与实际声源位置之间的最大角度误差不得超过±5°。 (2) 最大空间距离误差:定位结果与实际声源位置之间的最大空间距离误差不得超过0.5米。 (3) 动态响应: 系统应在声源位置变化后的1000毫秒内,完成声源定位并输出结果。 (4) 实时性: 系统的声源定位响应延迟应不超过500毫秒。 5.5.2 测试要求 (1) 时间差法测试:使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的时间,通过计算时间差来确定声源方向。 (2) 幅度差法测试: 使用多个微型麦克风阵列,同时记录声源信号到达每个麦克风的幅度差,通过计算幅度差来确定声源方向。 (3) 波束形成测试: 使用波束形成算法和多个麦克风,测试算法对声源定位的准确性和鲁棒性。 (4) 声源跟踪测试: 测试声源定位系统对运动声源的跟踪能力,包括声源的速度和加速度变化等。

T/BDAEA 003-2023相似标准


推荐





Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号