质量函数
用于评估时间序列数据的质量
示例数据集
点击查看
completeness
用于计算时间序列的完整性,其衡量的是数据不缺失的比例。
提示
函数 completeness 首先统计数据的行数 cnt 。然后考虑了数据列中可能出现的 NaN 和 Inf 的情况,对其进行线性平滑处理,同时统计上述两种特殊值计数 specialcnt 。再通过扫描数据统计缺失计数 misscnt 。则完整性 completeness 的计算公式
completeness(time_expresion, numeric_expression)
选项 | 描述 |
---|---|
time_expresion | 要操作的时间表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
numeric_expression | 要操作的数值表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
查看示例
consistency
计算时间序列的一致性,其衡量的是时序数据均匀分布的不密集冗余的比例。
consistency(time_expresion, numeric_expression)
选项 | 描述 |
---|---|
time_expresion | 要操作的时间表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
numeric_expression | 要操作的数值表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
提示
同函数 completeness
,经过缺失值填充后,通过扫描数据统计出冗余计数 redundancy 。则一致性 consistency 的计算公式:
查看示例
timeliness
用于计算时间序列的时效性,其衡量的是时序数据按时到达不延迟的比例。
timeliness(time_expresion, numeric_expression)
选项 | 描述 |
---|---|
time_expresion | 要操作的时间表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
numeric_expression | 要操作的数值表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
提示
同函数 completeness
,经过缺失值填充后,通过扫描数据统计出延迟计数 latecnt 。则时效性 timeliness
的计算公式:
查看示例
validity
用于计算时间序列的有效性,其衡量的是数据满足约束条件的比例。
validity(time_expresion, numeric_expression)
选项 | 描述 |
---|---|
time_expresion | 要操作的时间表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
numeric_expression | 要操作的数值表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
提示
首先统计数据的行数 cnt 。然后进行缺失值填充,去除其中的 NaN 和 Inf 。然后通过自定义计算方法得到计数 valuecnt、variationcnt、speedcnt、speedchangecnt 。则有效性 validity 的计算公式: