TR 41-2015
数据质量指标

Data quality metrics


 

 

非常抱歉,我们暂时无法提供预览,您可以试试: 免费下载 TR 41-2015 前三页,或者稍后再访问。

您也可以尝试购买此标准,
点击右侧 “立即购买” 按钮开始采购(由第三方提供)。

 

标准号
TR 41-2015
发布单位
SG-SPRING SG1
当前最新
TR 41-2015
 
 
适用范围
这套指南阐明并定义了一组通用的结构化和机器可读数据集的与领域无关的数据质量指标。数据可能包括: - 包含过去信息的历史数据(例如图书馆借书、交易记录); - 包含当前信息的实时数据(例如图书馆图书可用性)。数据可以以下列形式提供: - 点数据,以某些离散的时间间隔不时收集或记录; - 数据流,包括连续、稳定的流或信息序列。示例包括股票价格、市场数据馈送、感官馈送和视频馈送。非结构化数据集的数据质量指标目前超出了本文档的范围,建议的指南可能适用也可能不适用于非结构化数据集。行业不可知论和普遍性是选择包含在基本质量指标集中的过程中的基本问题。虽然其他指标可能举例说明某些行业使用的数据集中的数据质量,但如果它们可能不容易全面应用,则它们不会包含在这些指南中。然而,鼓励数据提供者采用 4.2“目标-问题-度量”方法中描述的方法来开发额外的度量,以帮助传达数据质量的特定方面,从而帮助潜在买家评估所提供的数据集。以下内容超出了技术参考的范围: - 需要解释或解决构成买方评估过程一部分的问题的指标也不属于这些指南的范围。 - 也不包括从多个基本度量导出的度量,其中计算或导出方法可能根据用户的需要而变化。例如,非空记录与最大可能记录数的比率可以指示数据集的完整性或广泛性。然而,由于某些类型的数据集可能没有最大记录数或预期记录数,因此评估数据集的用户将根据他们的要求和期望将已发布的指标置于上下文中。 - 关于应用已发布指标的方法的建议,以回答与数据质量有关的更高阶问题。请注意,所包含的一些指标并非数据固有的,例如访问成本和支持。然而,它们已作为指南的一部分包含在内,因为它们是重要的考虑因素,并为用户提供数据集可行性的有用指标。

TR 41-2015相似标准





Copyright ©2007-2022 ANTPEDIA, All Rights Reserved
京ICP备07018254号 京公网安备1101085018 电信与信息服务业务经营许可证:京ICP证110310号