AINode

AINode 是支持时序相关模型注册、管理、调用的 IoTDB 原生节点,内置业界领先的自研时序大模型,如清华自研时序模型 Timer 系列,可通过标准 SQL 语句进行调用,实现时序数据的毫秒级实时推理,可支持时序趋势预测、缺失值填补、异常值检测等应用场景。

系统架构如下图所示:

三种节点的职责如下:

  • ConfigNode:负责分布式节点管理和负载均衡。
  • DataNode:负责接收并解析用户的 SQL请求;负责存储时间序列数据;负责数据的预处理计算。
  • AINode:负责时序模型的管理和使用。

1. 优势特点

与单独构建机器学习服务相比,具有以下优势:

  • 简单易用:无需使用 Python 或 Java 编程,使用 SQL 语句即可完成机器学习模型管理与推理的完整流程。如创建模型可使用CREATE MODEL语句、使用模型进行推理可使用 CALL INFERENCE (...) 语句等,使用更加简单便捷。
  • 避免数据迁移:使用 IoTDB 原生机器学习可以将存储在 IoTDB 中的数据直接应用于机器学习模型的推理,无需将数据移动到单独的机器学习服务平台,从而加速数据处理、提高安全性并降低成本。

  • 内置先进算法:支持业内领先机器学习分析算法,覆盖典型时序分析任务,为时序数据库赋能原生数据分析能力。如:
    • 时间序列预测(Time Series Forecasting):从过去时间序列中学习变化模式;从而根据给定过去时间的观测值,输出未来序列最可能的预测。
    • 时序异常检测(Anomaly Detection for Time Series):在给定的时间序列数据中检测和识别异常值,帮助发现时间序列中的异常行为。

2. 基本概念

  • 模型(Model):机器学习模型,以时序数据作为输入,输出分析任务的结果或决策。模型是 AINode 的基本管理单元,支持模型的增(注册)、删、查、改(微调)、用(推理)。
  • 创建(Create): 将外部设计或训练好的模型文件或算法加载到 AINode 中,由 IoTDB 统一管理与使用。
  • 推理(Inference):使用创建的模型在指定时序数据上完成该模型适用的时序分析任务。
  • 内置能力(Built-in):AINode 自带常见时序分析场景(例如预测与异常检测)的机器学习算法或自研模型。

3. 安装部署

AINode 的部署可参考文档 AINode 部署

4. 使用指导

TimechoDB-AINode 支持模型推理、模型微调以及模型管理(注册、查看、删除、加载、卸载等)三大功能,下面章节将进行详细说明。

4.1 模型推理

SQL语法如下:

call inference(<model_id>,inputSql,(<parameterName>=<parameterValue>)*)

在完成模型的注册后(内置模型推理无需注册流程),通过call关键字,调用inference函数就可以使用模型的推理功能,其对应的参数介绍如下:

  • model_id: 对应一个已经注册的模型

  • sql:sql查询语句,查询的结果作为模型的输入进行模型推理。查询的结果中行列的维度需要与具体模型config中指定的大小相匹配。(这里的sql不建议使用SELECT *子句,因为在IoTDB中,*并不会对列进行排序,因此列的顺序是未定义的,可以使用SELECT ot 的方式确保列的顺序符合模型输入的预期)

  • parameterName/parameterValue:参数名/参数值,目前支持:

    参数名称参数类型参数描述默认值
    generateTimeboolean返回结果是否包含时间戳列false
    outputLengthint指定返回结果的输出长度96

说明:

  1. 使用内置时序大模型进行推理的前提条件是本地存有对应模型权重,目录为 /TIMECHODB_AINODE_HOME/data/ainode/models/builtin/model_id/。若本地没有模型权重,则会自动从 HuggingFace 拉取,请保证本地能直接访问 HuggingFace。
  2. 在深度学习应用中,经常将时间戳衍生特征(数据中的时间列)作为生成式任务的协变量,一同输入到模型中以提升模型的效果,但是在模型的输出结果中一般不包含时间列。为了保证实现的通用性,模型推理结果只对应模型的真实输出,如果模型不输出时间列,则结果中不会包含。

示例

样本数据 ETTh-tree

下面是使用 sundial 模型推理的一个操作示例,输入 96 行, 输出 48 行,我们通过SQL使用其进行推理。

IoTDB> select OT from root.db.**
+-----------------------------+---------------+
|                         Time|root.db.etth.OT|
+-----------------------------+---------------+
|2016-07-01T00:00:00.000+08:00|         30.531|
|2016-07-01T01:00:00.000+08:00|         27.787|
|2016-07-01T02:00:00.000+08:00|         27.787|
|2016-07-01T03:00:00.000+08:00|         25.044|
|2016-07-01T04:00:00.000+08:00|         21.948|
|  ......                     |        ...... |
|2016-07-04T19:00:00.000+08:00|         29.546|
|2016-07-04T20:00:00.000+08:00|         29.475|
|2016-07-04T21:00:00.000+08:00|         29.264|
|2016-07-04T22:00:00.000+08:00|         30.953|
|2016-07-04T23:00:00.000+08:00|         31.726|
+-----------------------------+---------------+
Total line number = 96  

IoTDB> call inference(sundial,"select OT from root.db.**", generateTime=True, outputLength=48)
+-----------------------------+------------------+
|                         Time|            output|
+-----------------------------+------------------+
|2016-07-04T23:00:00.000+08:00|30.537494659423828|
|2016-07-04T23:59:22.500+08:00|29.619892120361328|
|2016-07-05T00:58:45.000+08:00|28.815832138061523|
|2016-07-05T01:58:07.500+08:00| 27.91131019592285|
|2016-07-05T02:57:30.000+08:00|26.893848419189453|
|  ......                     | ......           |
|2016-07-06T17:33:07.500+08:00| 24.40607261657715|
|2016-07-06T18:32:30.000+08:00| 25.00441551208496|
|2016-07-06T19:31:52.500+08:00|24.907312393188477|
|2016-07-06T20:31:15.000+08:00|25.156436920166016|
|2016-07-06T21:30:37.500+08:00|25.335433959960938|
+-----------------------------+------------------+
Total line number = 48

4.2 模型微调

AINode 支持通过 SQL 进行模型微调任务。

SQL 语法

createModel
    | CREATE MODEL modelId=identifier (WITH HYPERPARAMETERS LR_BRACKET hparamPair (COMMA hparamPair)* RR_BRACKET)? FROM MODEL existingModelId=identifier ON DATASET LR_BRACKET trainingData RR_BRACKET
    ;
    
trainingData
    : dataElement(COMMA dataElement)*
    ;

dataElement
    : pathPatternElement (LR_BRACKET timeRange RR_BRACKET)?
    ;

pathPatternElement
    : PATH path=prefixPath
    ;

参数说明

名称描述
modelId微调出的模型的唯一标识
hparamPair微调使用的超参数 key-value 对,目前支持如下:
train_epochs: int 类型,微调轮数
iter_per_epoch: int 类型,每轮微调的迭代次数
learning_rate: double 类型,学习率
existingModelId微调使用的基座模型
trainingData微调使用的数据集

示例

  1. 选择测点 root.db.etth.ot 中指定时间范围的数据作为微调数据集,基于 sundial 创建模型 sundialv2.
IoTDB> CREATE MODEL sundialv2 FROM MODEL sundial ON DATASET (PATH root.db.etth.OT([1467302400000, 1467644400000)))
Msg: The statement is executed successfully.
IoTDB> show models
+---------------------+---------+-----------+---------+
|              ModelId|ModelType|   Category|    State|
+---------------------+---------+-----------+---------+
|                arima|   sktime|    builtin|   active|
|          holtwinters|   sktime|    builtin|   active|
|exponential_smoothing|   sktime|    builtin|   active|
|     naive_forecaster|   sktime|    builtin|   active|
|       stl_forecaster|   sktime|    builtin|   active|
|         gaussian_hmm|   sktime|    builtin|   active|
|              gmm_hmm|   sktime|    builtin|   active|
|                stray|   sktime|    builtin|   active|
|             timer_xl|    timer|    builtin|   active|
|              sundial|  sundial|    builtin|   active|
|             chronos2|       t5|    builtin|   active| 
|            sundialv2|  sundial| fine_tuned| training| 
+---------------------+---------+-----------+---------+
  1. 微调任务后台异步启动,可在 AINode 进程看到 log;微调完成后,查询并使用新的模型
IoTDB> show models
+---------------------+---------+-----------+---------+
|              ModelId|ModelType|   Category|    State|
+---------------------+---------+-----------+---------+
|                arima|   sktime|    builtin|   active|
|          holtwinters|   sktime|    builtin|   active|
|exponential_smoothing|   sktime|    builtin|   active|
|     naive_forecaster|   sktime|    builtin|   active|
|       stl_forecaster|   sktime|    builtin|   active|
|         gaussian_hmm|   sktime|    builtin|   active|
|              gmm_hmm|   sktime|    builtin|   active|
|                stray|   sktime|    builtin|   active|
|             timer_xl|    timer|    builtin|   active|
|              sundial|  sundial|    builtin|   active|
|             chronos2|       t5|    builtin|   active|
|            sundialv2|  sundial| fine_tuned|   active| 
+---------------------+---------+-----------+---------+

4.3 注册自定义模型

符合以下要求的 Transformers 模型可以注册到 AINode 中:

  1. AINode 目前使用 v4.56.2 版本的 transformers,构建模型时需避免继承低版本(<4.50)接口

  2. 模型需继承一类 AINode 的推理任务流水线(当前支持预测流水线):

    • iotdb-core/ainode/iotdb/ainode/core/inference/pipeline/basic_pipeline.py

    V2.0.9.3 之前

    class BasicPipeline(ABC):
        def __init__(self, model_id, **model_kwargs):
            self.model_info = model_info
            self.device = model_kwargs.get("device", "cpu")
            self.model = load_model(model_info, device_map=self.device, **model_kwargs)
    
        @abstractmethod
        def preprocess(self, inputs, **infer_kwargs):
            """
            在推理任务开始前对输入数据进行前处理,包括形状验证和数值转换。
            """
            pass
    
        @abstractmethod
        def postprocess(self, output, **infer_kwargs):
            """
            在推理任务结束后对输出结果进行后处理。
            """
            pass
    
    
    class ForecastPipeline(BasicPipeline):
        def __init__(self, model_info, **model_kwargs):
            super().__init__(model_info, model_kwargs=model_kwargs)
    
        def preprocess(self, inputs: list[dict[str, dict[str, torch.Tensor] | torch.Tensor]], **infer_kwargs):
            """
            在将输入数据传递给模型进行推理之前进行预处理,验证输入数据的形状和类型。
    
            Args:
                inputs (list[dict]):
                    输入数据,字典列表,每个字典包含:
                        - 'targets': 形状为 (input_length,) 或 (target_count, input_length) 的张量。
                        - 'past_covariates': 可选,张量字典,每个张量形状为 (input_length,)。
                        - 'future_covariates': 可选,张量字典,每个张量形状为 (input_length,)。
    
                infer_kwargs (dict, optional): 推理的额外关键字参数,如:
                    - `output_length`(int): 如果提供'future_covariates',用于验证其有效性。
    
            Raises:
                ValueError: 如果输入格式不正确(例如,缺少键、张量形状无效)。
    
            Returns:
                经过预处理和验证的输入数据,可直接用于模型推理。
            """
            pass
    
        def forecast(self, inputs, **infer_kwargs):
            """
            对给定输入执行预测。
    
            Parameters:
                inputs: 用于进行预测的输入数据。类型和结构取决于模型的具体实现。
                **infer_kwargs: 额外的推理参数,例如:
                    - `output_length`(int): 模型应该生成的时间点数量。
    
            Returns:
                预测输出,具体形式取决于模型的具体实现。
            """
            pass
    
        def postprocess(self, outputs: list[torch.Tensor], **infer_kwargs) -> list[torch.Tensor]:
            """
            在推理后对模型输出进行后处理,验证输出数据的形状并确保其符合预期维度。
    
            Args:
                outputs:
                    模型输出,2D张量列表,每个张量形状为 `[target_count, output_length]`。
    
            Raises:
                InferenceModelInternalException: 如果输出张量形状无效(例如,维数错误)。
                ValueError: 如果输出格式不正确。
    
            Returns:
                list[torch.Tensor]:
                    后处理后的输出,将是一个2D张量列表。
            """
            pass
    

    V2.0.9.3 起

     class BasicPipeline(ABC):
     def __init__(self, model_id, **model_kwargs):
         self.model_info = model_info
         self.device = model_kwargs.get("device", "cpu")
         self.model = load_model(model_info, device_map=self.device, **model_kwargs)
    
     @abstractmethod
     def preprocess(self, inputs, **infer_kwargs):
         """
         在推理任务开始前对输入数据进行前处理,包括形状验证和数值转换。
         """
         pass
    
     @abstractmethod
     def postprocess(self, output, **infer_kwargs):
         """
         在推理任务结束后对输出结果进行后处理。
         """
         pass
    
    
     class ForecastPipeline(BasicPipeline):
     def __init__(self, model_info, **model_kwargs):
     super().__init__(model_info, model_kwargs=model_kwargs)
    
     def _preprocess(
         self,
         inputs: list[dict[str, dict[str, torch.Tensor] | torch.Tensor]],
         **infer_kwargs,
     ):
         """
         在将输入数据传递给模型进行推理之前进行预处理,验证输入数据的形状和类型。
    
         Args:
             inputs (list[dict[str, dict[str, torch.Tensor] | torch.Tensor]]):
                 输入数据,字典列表,每个字典包含:
                     - 'targets': 形状为 (input_length,) 或 (target_count, input_length) 的张量。
                     - 'past_covariates': 可选,张量字典,每个张量形状为 (input_length,)。
                     - 'future_covariates': 可选,张量字典,每个张量形状为 (input_length,)。
    
             infer_kwargs (dict, optional): 推理的额外关键字参数,如:
                 - `output_length`(int): 如果提供'future_covariates',用于验证其有效性。
    
         Raises:
             ValueError: 如果输入格式不正确(例如,缺少键、张量形状无效)。
    
         Returns:
             经过预处理和验证的输入数据,可直接用于模型推理。
         """
         pass
    
     def forecast(self, inputs, **infer_kwargs):
         """
         对给定输入执行预测。
    
         Parameters:
             inputs: 用于进行预测的输入数据。类型和结构取决于模型的具体实现。
             **infer_kwargs: 额外的推理参数,例如:
                 - `output_length`(int): 模型应该生成的时间点数量。
    
         Returns:
             预测输出,具体形式取决于模型的具体实现。
         """
         pass
    
     def _postprocess(self, outputs, **infer_kwargs) -> list[torch.Tensor]:
         """
         在推理后对模型输出进行后处理,验证输出数据的形状并确保其符合预期维度。
    
         Args:
             outputs:
                 模型输出,2D张量列表,每个张量形状为 `[target_count, output_length]`。
    
         Raises:
             InferenceModelInternalException: 如果输出张量形状无效(例如,维数错误)。
             ValueError: 如果输出格式不正确。
    
         Returns:
             list[torch.Tensor]:
                 后处理后的输出,将是一个2D张量列表。
         """
         pass
    
  3. 修改模型配置文件 config.json,确保包含以下字段:

    V2.0.9.3 之前

    {
        "auto_map": {
            "AutoConfig": "config.Chronos2CoreConfig",        // 指定模型 Config 类
            "AutoModelForCausalLM": "model.Chronos2Model"     // 指定模型类
        },
        "pipeline_cls": "pipeline_chronos2.Chronos2Pipeline", // 指定模型的推理流水线
        "model_type": "custom_t5",                            // 指定模型类型
    }
    
    • 必须通过 auto_map 指定模型的 Config 类和模型类;
    • 必须集成并指定推理流水线类;
    • 对于 AINode 管理的内置(builtin)和自定义(user_defined)模型,模型类别(model_type)也作为不可重复的唯一标识。即,要注册的模型类别不得与任何已存在的模型类型重复,通过微调创建的模型将继承原模型的模型类别。

    V2.0.9.3 起

    参数 model_type 非必填

    {
        "auto_map": {
            "AutoConfig": "config.Chronos2CoreConfig",        // 指定模型 Config 类
            "AutoModelForCausalLM": "model.Chronos2Model"     // 指定模型类
        },
        "pipeline_cls": "pipeline_chronos2.Chronos2Pipeline", // 指定模型的推理流水线
    }
    
    • 必须通过 auto_map 指定模型的 Config 类和模型类;
    • 必须集成并指定推理流水线类;
  4. 确保要注册的模型目录包含以下文件,且模型配置文件名称和权重文件名称不支持自定义:

    • 模型配置文件:config.json;
    • 模型权重文件:model.safetensors;
    • 模型代码:其它 .py 文件。

注册自定义模型的 SQL 语法如下所示:

CREATE MODEL <model_id> USING URI <uri>

参数说明:

  • model_id:自定义模型的唯一标识;不可重复,有以下约束:
    • 允许出现标识符 [ 0-9 a-z A-Z _ ] (字母,数字(非开头),下划线(非开头))
    • 长度限制为 2-64 字符
    • 大小写敏感
  • uri:包含模型代码和权重的本地 uri 地址。

注册示例:

从本地路径上传自定义 Transformers 模型,AINode 会将该文件夹拷贝至 user_defined 目录中。

CREATE MODEL chronos2 USING URI 'file:///path/to/chronos2'

SQL执行后会异步进行注册的流程,可以通过模型展示查看模型的注册状态(见查看模型章节)。模型注册完成后,就可以通过使用正常查询的方式调用具体函数,进行模型推理。

4.4 查看模型

注册成功的模型可以通过查看指令查询模型的具体信息。

SHOW MODELS

除了直接展示所有模型的信息外,可以指定model_id来查看某一具体模型的信息。

SHOW MODELS <model_id> -- 只展示特定模型

模型展示的结果中包含如下内容:

ModelIdModelTypeCategoryState
模型ID模型类型模型种类模型状态

其中,State 模型状态机流转示意图如下:

状态机流程说明:

  1. 启动 AINode 后,执行 show models 命令,仅能查看到**系统内置(BUILTIN)**的模型。
  2. 用户可导入自己的模型,这类模型的来源标识为用户自定义(USER_****DEFINED);AINode 会尝试从模型配置文件中解析模型类型(ModelType),若解析失败,该字段则显示为空。
  3. 时序大模型(内置模型)权重文件不随 AINode 打包,AINode 启动时自动下载。
    1. 下载过程中为 ACTIVATING,下载成功转变为 ACTIVE,失败则变成 INACTIVE。
  4. 用户启动模型微调任务后,正在训练的模型状态为 TRAINING,训练成功变为 ACTIVE,失败则是 FAILED。
  5. 若微调任务成功,微调结束后会统计所有 ckpt (训练文件)中指标最佳的文件并自动重命名,变成用户指定的 model_id。

查看示例

IoTDB> show models
+---------------------+--------------+--------------+-------------+
|              ModelId|     ModelType|      Category|        State|
+---------------------+--------------+--------------+-------------+
|                arima|        sktime|       builtin|       active|
|          holtwinters|        sktime|       builtin|       active|
|exponential_smoothing|        sktime|       builtin|       active|
|     naive_forecaster|        sktime|       builtin|       active|
|       stl_forecaster|        sktime|       builtin|       active|
|         gaussian_hmm|        sktime|       builtin|       active|
|              gmm_hmm|        sktime|       builtin|       active|
|                stray|        sktime|       builtin|       active|
|               custom|              |  user_defined|       active|
|             timer_xl|         timer|       builtin|   activating|
|              sundial|       sundial|       builtin|       active|
|           sundialx_1|       sundial|    fine_tuned|       active|
|           sundialx_4|       sundial|    fine_tuned|     training|
|           sundialx_5|       sundial|    fine_tuned|       failed|
|             chronos2|            t5|       builtin|     inactive|
+---------------------+--------------+--------------+-------------+

内置传统时序模型介绍如下:

模型名称核心概念适用场景主要特点
ARIMA(自回归整合移动平均模型)结合自回归(AR)、差分(I)和移动平均(MA),用于预测平稳时间序列或可通过差分变为平稳的数据。单变量时间序列预测,如股票价格、销量、经济指标等。1. 适用于线性趋势和季节性较弱的数据。2. 需要选择参数 (p,d,q)。3. 对缺失值敏感。
Holt-Winters(三参数指数平滑)基于指数平滑,引入水平、趋势和季节性三个分量,适用于具有趋势和季节性的数据。有明显季节性和趋势的时间序列,如月度销售额、电力需求等。1. 可处理加性或乘性季节性。2. 对近期数据赋予更高权重。3. 简单易实现。
Exponential Smoothing(指数平滑)通过加权平均历史数据,权重随时间指数递减,强调近期观测值的重要性。无显著季节性但存在趋势的数据,如短期需求预测。1. 参数少,计算简单。2. 适合平稳或缓慢变化序列。3. 可扩展为双指数或三指数平滑。
Naive Forecaster(朴素预测器)使用最近一期的观测值作为下一期的预测值,是最简单的基准模型。作为其他模型的比较基准,或数据无明显模式时的简单预测。1. 无需训练。2. 对突发变化敏感。3. 季节性朴素变体可用前一季节同期值预测。
STL Forecaster(季节趋势分解预测)基于STL分解时间序列,分别预测趋势、季节性和残差分量后组合。具有复杂季节性、趋势和非线性模式的数据,如气候数据、交通流量。1. 能处理非固定季节性。2. 对异常值稳健。3. 分解后可结合其他模型预测各分量。
Gaussian HMM(高斯隐马尔可夫模型)假设观测数据由隐藏状态生成,每个状态的观测概率服从高斯分布。状态序列预测或分类,如语音识别、金融状态识别。1. 适用于时序数据的状态建模。2. 假设观测值在给定状态下独立。3. 需指定隐藏状态数量。
GMM HMM (高斯混合隐马尔可夫模型)扩展Gaussian HMM,每个状态的观测概率由高斯混合模型描述,可捕捉更复杂的观测分布。需要多模态观测分布的场景,如复杂动作识别、生物信号分析。1. 比单一高斯更灵活。2. 参数更多,计算复杂度高。3. 需训练GMM成分数。
STRAY(基于奇异值的异常检测)通过奇异值分解(SVD)检测高维数据中的异常点,常用于时间序列异常检测。高维时间序列的异常检测,如传感器网络、IT系统监控。1. 无需分布假设。2. 可处理高维数据。3. 对全局异常敏感,局部异常可能漏检。

内置时序大模型介绍如下:

模型名称核心概念适用场景主要特点
Timer-XL支持超长上下文的时序大模型,通过大规模工业数据预训练增强泛化能力。需利用极长历史数据的复杂工业预测,如能源、航空航天、交通等领域。1. 超长上下文支持,可处理数万时间点输入。2. 多场景覆盖,支持非平稳、多变量及协变量预测。3. 基于万亿级高质量工业时序数据预训练。
Timer-Sundial采用“Transformer + TimeFlow”架构的生成式基础模型,专注于概率预测。需要量化不确定性的零样本预测场景,如金融、供应链、新能源发电预测。1. 强大的零样本泛化能力,支持点预测与概率预测 2. 可灵活分析预测分布的任意统计特性。3. 创新生成架构,实现高效的非确定性样本生成。
Chronos-2基于离散词元化范式的通用时序基础模型,将预测转化为语言建模任务。快速零样本单变量预测,以及可借助协变量(如促销、天气)提升效果的场景。1. 强大的零样本概率预测能力。2. 支持协变量统一建模,但对输入有严格要求:a. 未来协变量的名称组成的集合必须是历史协变量的名称组成的集合的子集;b. 每个历史协变量的长度必须等于目标变量的长度; c. 每个未来协变量的长度必须等于预测长度;3. 采用高效的编码器式结构,兼顾性能与推理速度。

4.5 删除模型

对于注册成功的模型,用户可以通过 SQL 进行删除,AINode 会将 user_defined 目录下的对应模型文件夹整个删除。其 SQL 语法如下:

DROP MODEL <model_id>

需要指定已经成功注册的模型 model_id 来删除对应的模型。由于模型删除涉及模型数据清理,操作不会立即完成,此时模型的状态为 DROPPING,该状态的模型不能用于模型推理。请注意,该功能不支持删除内置模型。

4.6 加载/卸载模型

为适应不同场景,AINode 提供以下两种模型加载策略:

  • 即时加载:即推理时临时加载模型,结束后释放资源。适用于测试或低负载场景。
  • 常驻加载:即将模型持久化加载在内存(CPU)或显存(GPU)中,以支持高并发推理。用户只需通过 SQL 指定加载或卸载的模型,AINode 会自动管理实例数量。当前常驻模型的状态也可随时查看。

下文将详细介绍加载/卸载模型的相关内容:

  1. 配置参数

支持通过编辑如下配置项设置常驻加载相关参数。

# AINode 在推理时可使用的设备内存/显存占总量的比例
# Datatype: Float
ain_inference_memory_usage_ratio=0.4

# AINode 每个加载的模型实例需要占用的内存比例,即模型占用*该值
# Datatype: Float
ain_inference_extra_memory_ratio=1.2
  1. 展示可用的 device

支持通过如下 SQL 命令查看所有可用的设备 ID

SHOW AI_DEVICES

示例

IoTDB> show ai_devices
+-------------+
|     DeviceId|
+-------------+
|          cpu|
|            0|
|            1|
+-------------+
  1. 加载模型

支持通过如下 SQL 命令手动加载模型,系统根据硬件资源使用情况自动均衡模型实例数量。

LOAD MODEL <existing_model_id> TO DEVICES <device_id>(, <device_id>)*

参数要求

  • existing_model_id: 指定的模型 id,当前版本仅支持 timer_xl 和 sundial。
  • device_id: 模型加载的位置。
    • cpu: 加载到 AINode 所在服务器的内存中。
    • gpu_id: 加载到 AINode 所在服务器的对应显卡中,如 “0, 1” 表示加载到编号为 0 和 1 的两张显卡中。

示例

LOAD MODEL sundial TO DEVICES 'cpu,0,1'
  1. 卸载模型

支持通过如下 SQL 命令手动卸载指定模型的所有实例,系统会重分配空闲出的资源给其他模型

UNLOAD MODEL <existing_model_id> FROM DEVICES <device_id>(, <device_id>)*

参数要求

  • existing_model_id: 指定的模型 id,当前版本仅支持 timer_xl 和 sundial。
  • device_id: 模型加载的位置。
    • cpu: 尝试从 AINode 所在服务器的内存中卸载指定模型。
    • gpu_id: 尝试从 AINode 所在服务器的对应显卡中卸载指定模型,如 “0, 1” 表示尝试从编号为 0 和 1 的两张显卡卸载指定模型。

示例

UNLOAD MODEL sundial FROM DEVICES 'cpu,0,1'
  1. 展示加载的模型

支持通过如下 SQL 命令查看已经手动加载的模型实例,可通过 device_id 指定设备。

SHOW LOADED MODELS
SHOW LOADED MODELS <device_id>(, <device_id>)* # 展示指定设备中的模型实例

示例:在内存、gpu_0 和 gpu_1 两张显卡加载了sundial 模型

IoTDB> show loaded models
+-------------+--------------+------------------+
|     DeviceId|       ModelId|  Count(instances)|
+-------------+--------------+------------------+
|          cpu|       sundial|                 4|
|            0|       sundial|                 6|
|            1|       sundial|                 6|
+-------------+--------------+------------------+

说明:

  • DeviceId : 设备 ID
  • ModelId :加载的模型 ID
  • Count(instances) :每个设备中的模型实例数量(系统自动分配)

4.7 时序大模型介绍

AINode 目前支持多种时序大模型,相关介绍及部署使用可参考时序大模型

5. 权限管理

使用 AINode 相关的功能时,可以使用IoTDB本身的鉴权去做一个权限管理,用户只有在具备 USE_MODEL 权限时,才可以使用模型管理的相关功能。当使用推理功能时,用户需要有访问输入模型的 SQL 对应的源序列的权限。

权限名称权限范围管理员用户(默认ROOT)普通用户路径相关
USE_MODELcreate model / show models / drop modelx
READ_DATAcall inference