两步聚合
首先,通过使用聚合函数创建一个中间聚合,而不是在一步中计算最终结果。然后,使用分析函数计算最终结果。
- 社区版
- 企业版
stats_agg
对二维数据执行线性回归分析,例如计算相关系数和协方差。 并且还可以分别计算每个维度的常见统计数据,将数据聚合成中间统计聚合形式,以便进行进一步计算。
提示
只有 x
和 y
都不为空时才会纳入聚合。
stats_agg(y, x)
选项 | 描述 |
---|---|
y | 要进行统计聚合的数据集中的y 值。 |
x | 要进行统计聚合的数据集中的x 值。 |
查看 stats_agg
示例
stats_agg
支持以下二次聚合的函数
函数 | 描述 |
---|---|
num_vals | 计算二维统计总量中的数值个数。 |
average_y , average_x | 计算二维统计聚合后指定维度的平均值。 |
sum_y , sum_x | 计算二维统计聚合后指定维度的和,方式为 population。 |
stddev_samp_y , stddev_samp_x | 计算二维统计聚合后指定维度的标准差,方式为 sample。 |
stddev_pop_y , stddev_pop_x | 计算二维统计聚合后指定维度的标准差,方式为 population。 |
var_samp_y , var_samp_x | 计算二维统计聚合后指定维度的方差,方式为 sample。 |
var_pop_y , var_pop_x | 计算二维统计聚合后指定维度的方差,方式为 population。 |
skewness_samp_y , skewness_samp_x | 计算二维统计聚合后指定维度的偏度值,方式为 sample。 |
skewness_pop_y , skewness_pop_x | 计算二维统计聚合后指定维度的偏度值,方式为 population。 |
kurtosis_samp_y , kurtosis_samp_x | 计算二维统计聚合后指定维度的峰度值,方式为 sample。 |
kurtosis_pop_y , kurtosis_pop_x | 计算二维统计聚合后指定维度的峰度值,方式为 population。 |
correlation | 计算二维统计聚合后的相关。 |
covariance_samp , covariance_pop | 计算二维统计聚合后的协方差。 |
determination_coeff | 计算二维统计聚合后的决定系数。 |
slope | 根据二维统计聚合,计算线性拟合线的斜率。 |
intercept | 计算二维统计聚合后y的截距。 |
x_intercept | 计算二维统计聚合后x的截距。 |
查看二次聚合的示例
gauge_agg
分析 Gauge数据。与 Counter 不同,Gauge可以减少也可以增加。
gauge_agg(time, numeric_expression)
选项 | 描述 |
---|---|
numeric_expression | 要操作的数字表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
查看 gauge_agg
示例
gauge_agg
支持以下二次聚合的函数
函数 | 描述 |
---|---|
delta | 获取一段时间内Gauge的变化。这是简单的增量,通过从第一个值减去最后一个看到的值来计算。 |
time_delta | 获取持续时间,最后一个 Gauge 的时间减去第一个 Gauge 的时间。 |
rate | 计算 Gauge 变化和时间变化的比率。 |
first_time | 取得 Gauge 中最小的时间戳。 |
last_time | 取得 Gauge 中最大的时间戳。 |
first_val | 取得 Gauge 中最小时间戳对应的值。 |
last_val | 取得 Gauge 中最大时间戳对应的值。 |
idelta_left | 计算 Gauge 最早的瞬时变化。这等于第二个值减去第一个值。 |
idelta_right | 计算 Gauge 最晚的瞬时变化。这等于最后一个值值减去倒数第二个值。 |
compact_state_agg
给定一个在离散状态之间切换的系统或值,汇总每个状态所花费的时间。例如,您可以使用compact_state_agg
函数来跟踪系统在error
、running
或starting
状态下花费的时间。
compact_state_agg(time_expression, state)
选项 | 描述 |
---|---|
time_expression | 要操作的时间表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
查看 compact_state_agg
示例
以上示例将状态数据汇总在一起,以便进一步分析,compact_state_agg
支持如下二次聚合函数:
函数 | 描述 |
---|---|
duration_in | 统计某个状态的持续时间,或统计某个状态在某个时间段内的持续时间。 |
duration_in
duration_in(state_agg_data, state [,begin_time, interval_time])
选项 | 描述 |
---|---|
state_agg_data | state_agg_data 函数返回的结果集。 |
state | any 与 compact_state_agg 的 state 类型相同。 |
begin_time | 可选,指定时间段内的开始时间。 |
interval_time | 可选,指定时间段的持续时间,不指定时,时间段为无穷大。 |
查看 duration_in
示例
state_agg
给定一个在离散状态之间切换的系统或值,跟踪状态之间的转换。
state_agg(time_expression, state)
统计每个状态所花费的时间。
查看 state_agg
示例
以上示例将状态数据汇总在一起,以便进一步分析,state_agg
支持如下二次聚合函数:
函数 | 描述 |
---|---|
duration_in | 统计某个状态的持续时间,或统计某个状态在某个时间段内的持续时间。 |
state_at | 统计一时刻所处的状态。 |
duration_in
duration_in(state_agg_data, state [,begin_time, interval_time])
选项 | 描述 |
---|---|
state_agg_data | state_agg 函数返回的结果集。 |
state | any 与 compact_state_agg 的 state 类型相同。 |
begin_time | 可选,指定时间段内的开始时间。 |
interval_time | 可选,指定时间段的持续时间,不指定时,时间段为无穷大。 |
查看 duration_in
示例
state_at
state_at(state_agg_data, time_expression)
选项 | 描述 |
---|---|
state_agg_data | state_agg 函数返回的结果集。 |
time_expression | 要操作的时间表达式。可以是常量、列或函数,以及算术运算符的任意组合。 |
查看 state_at
示例
- 社区版
- 企业版
candlestick_agg
进行金融资产数据分析,能得到股票的开盘价和收盘价,以及最低和最高价。
candlestick_agg(time, price, volume)
查看 candlestick_agg
示例
可以在上述示例中分别提取开盘价、收盘价等。支持的函数有:
函数 | 描述 |
---|---|
close | 收盘价。 |
close_time | 收盘时间。 |
high | 最高价。 |
high_time | 最高价时间。 |
low | 最低价。 |
low_time | 最低价时间。 |
open | 开盘价。 |
open_time | 开盘时间。 |
volume | 总成加量。 |
vwap | 成交量加权平均价格。 |