概览信息

HyperTS是由数据科学平台领导厂商 DataCanvas 创建的开源项目。


什么是HyperTS?

HyperTS是 DataCanvas Automatic Toolkits(DAT) 针对于 时间序列 任务推出了一款涵盖 自动机器学习(AutoML)自动深度学习(AutoDL) 的全Pipeline学习工具。它涵盖了数据清洗、数据预处理、特征工程、模型选择、超参数优化、模型评估、预测可视化等一系列自动化的操作, 轻松几行代码便可以完全 端到端 地处理多种场景下的时间序列任务。


为什么选择HyperTS?

在如今层出不穷的时间序列工具中, 为什么要选择使用HyerTS而非其他?

  • HyerTS提供了统一的接口对于多种时间序列任务, 包括时序预测, 时序分类,时序回归以及时序异常检测等。

    大部分的时间序列工具主要解决时序预测问题, 当问题发生转化或者场景转变时, 便会陷入窘境而束手无策。用户要么重新学习其他的工具, 要么自己根据专家经验搭建模型。费时费力, 效果却差强人意。而HyperTS面对如此情景, 便可以凭借统一化接口的特性, 使您无感知切换多种场景进行时序建模分析。

  • HyerTS支持多种时序变量。

    无论数据是单变量时序, 多变量时序, 亦或是包含辅助建模的协变量, 均可以满足您轻松建模。

  • HyperTS内置了丰富的算法空间, 实现多模驱动, 轻重结合。

    面对小规模的简单任务, 希望快速建模分析时序特性, 您可以选择开启统计模型模式(STATS)。HyperTS可以在Prophet, ARIMA, VAR等统计模型搜索空间中优化出最优秀的模型拿来分析数据。 面对大规模的复杂任务, 希望获得高精度的模型指导决策, 您可以选择开启深度学习模式(DL)。在此模式下, HyperTS将从DeepAR, RNN, GRU, LSTM, LSTNet等深度模型中搜索搭建出更鲁棒的神经网络架构。此外, DL内置对GPU的支持, 从而加快建模速度。

  • HyperTS采用极简的操作而输出丰富的分析结果。

    仅需几行代码便可执行起强大的实验搜索工作。它不仅解决了算法的超参数优化问题, 而且从数据清洗到算法优化的整个建模过程统一化的放入了同一个搜索空间中, 在 Hypernets 提供的蒙特卡洛树搜索、进化算法、强化学习并结合元学习器等搜索算法的支持下, HyperTS有效且高效地解决了全Pipeline的时间序列建模及数据分析。 实验建模结束, 通过 predict(), evaluate(), plot() 等简单操作, 便可输出多种评估指标结果, 预测目标置信区间, 交互式可视化图表等丰富的结果及分析报告。

功能矩阵

HyperTS的功能特性清单及各种的运行模式的支持情况如下表:

功能特性

模型或功能

当前版本

未来版本

数据清洗

删除重复时间行

列类型校正

id列清理

协变量常量列清理

协变量大量缺失列清理

删除标签为空的样本

数据预处理

时间序列连续性补齐

缺失值简单填充

缺失值周期性滑动填充

离群点处理

OrdinalEncoder

LabelEncoder

StandardScaler

MinMaxScaler

MaxAbsScaler

Log(x+1)

数据集拆分

按时间顺序拆分训练集与测试集

以滑窗构建时序预测数据集的X及y

模式模型

Prophet —> 统计模式 | 单变量 | 预测

ARIMA —> 统计模式 | 单变量 | 预测

VAR —> 统计模式 | 多变量 | 预测

Theta —> 统计模式 | 单变量 | 预测

TSForest —> 统计模式 | 单变量 | 分类

KNeighbors —> 统计模式 | 单/多变量 | 分类

TSIsolationForest —> 统计模式 | 单/多变量 | 异常检测

TSOneClassSVM —> 统计模式 | 单/多变量 | 异常检测

DeepAR —> 深度学习 | 单变量 | 预测 | 协变量

RNN —> 深度学习 | 单/多变量 | 预测/分类/回归 | 协变量

GRU —> 深度学习 | 单/多变量 | 预测/分类/回归 | 协变量

LSTM —> 深度学习 | 单/多变量 | 预测/分类/回归 | 协变量

LSTNet —> 深度学习 | 单/多变量 | 预测/分类/回归 | 协变量

InceptionTime —> 深度学习 | 单/多变量 | 分类

N-Beats —> 深度学习 | 单/多变量 | 预测 | 协变量

VAE —> 深度学习 | 单/多变量 | 异常检测 | 协变量

NAS —> 神经架构搜索 | 单/多变量 | 预测/分类/回归 | 协变量

评估方法

Train-Validation-Holdout验证

Rolling-Window-Evaluation验证

模型融合

GreedyEnsemble

可视化分析

绘制预测曲线

绘制预测趋势、季节性