用于写入 TsFile.
/** * @brief 用于将结构化表格数据写入具有指定模式的 TsFile。 * * TsFileTableWriter 类被设计用于写入结构化数据,特别适合时序数据, * 数据将被写入一种为高效存储与检索优化的文件格式(即 TsFile)。该类允许用户定义 * 所需写入表的模式,按照该模式添加数据行,并将这些数据序列化写入 TsFile。 * 此外,还提供了在写入过程中限制内存使用的选项。 */ class TsFileTableWriter { public: /** * TsFileTableWriter 用于将表格数据写入具有指定模式的目标文件, * 可选地限制内存使用。 * * @param writer_file 要写入表数据的目标文件。不能为空。 * @param table_schema 用于构造表结构,定义正在写入表的模式。 * @param memory_threshold 可选参数。当写入数据的大小超过该值时, * 数据将自动刷新到磁盘。默认值为 128MB。 */ TsFileTableWriter(WriteFile* writer_file, TableSchema* table_schema, uint64_t memory_threshold = 128 * 1024 * 1024); ~TsFileTableWriter(); /** * 将给定的 Tablet 数据按照表的模式写入目标文件。 * * @param tablet 包含待写入数据的 Tablet。不能为空。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int write_table(const Tablet& tablet); /** * 将所有缓冲数据刷新到底层存储介质,确保所有数据都已写出。 * 此方法确保所有未完成的写入操作被持久化。 * * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int flush(); /** * 关闭写入器并释放其占用的所有资源。 * 调用此方法后,不应再对该实例执行任何操作。 * * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int close(); };
描述表模式(schema)的数据结构。
/** * @brief 表示整个表的模式信息。 * * 此类包含描述特定表结构所需的元数据, * 包括表名以及所有列的模式信息。 */ class TableSchema { public: /** * 使用给定的表名和列模式构造一个 TableSchema 对象。 * * @param table_name 表的名称,必须为非空字符串。 * 此名称用于在系统中标识该表。 * @param column_schemas 一个包含 ColumnSchema 对象的向量。 * 每个 ColumnSchema 定义表中一列的模式。 */ TableSchema(const std::string& table_name, const std::vector<ColumnSchema>& column_schemas); }; /** * @brief 表示单个列的模式信息。 * * 此结构体包含描述特定列存储方式所需的元数据, * 包括列名、数据类型和列类别。 */ struct ColumnSchema { std::string column_name_; common::TSDataType data_type_; ColumnCategory column_category_; /** * @brief 使用给定参数构造一个 ColumnSchema 对象。 * * @param column_name 列的名称,必须为非空字符串。 * 此名称用于在表中标识该列。 * @param data_type 该列的数据类型,例如 INT32、DOUBLE、TEXT 等。 * 数据类型决定了数据的存储与解释方式。 * @param column_category 列的类别,用于标识其在模式中的角色或类型, * 例如 FIELD(字段)、TAG(标签)。 * 如果未指定,默认为 ColumnCategory::FIELD。 * @note 调用者有责任确保 `column_name` 非空。 */ ColumnSchema(std::string column_name, common::TSDataType data_type, ColumnCategory column_category = ColumnCategory::FIELD) : column_name_(std::move(column_name)), data_type_(data_type), column_category_(column_category) { } }; /** * @brief Represents the data type of a measurement. * * This enumeration defines the supported data types for measurements in the system. */ enum TSDataType : uint8_t { BOOLEAN = 0, INT32 = 1, INT64 = 2, FLOAT = 3, DOUBLE = 4, TEXT = 5, STRING = 11 };
/** * @brief 表示用于插入到表中的数据行集合及其相关元数据。 * * 此类用于管理和组织将要插入特定目标表的数据。 * 它负责存储时间戳和值,以及相关的元数据,如列名和数据类型。 */ class Tablet { public: /** * @brief 使用给定参数构造一个 Tablet 对象。 * * @param column_names 一个包含该 Tablet 中列名的向量。 * 每个名称对应目标表中的一列。 * @param data_types 一个包含每列数据类型的向量。 * 这些类型必须与目标表的模式相匹配。 * @param max_rows 该 Tablet 可容纳的最大行数,默认为 DEFAULT_MAX_ROWS。 */ Tablet(const std::vector<std::string> &column_names, const std::vector<common::TSDataType> &data_types, int max_rows = DEFAULT_MAX_ROWS); /** * @brief 向指定行添加时间戳。 * * @param row_index 要添加时间戳的行索引, * 必须小于最大行数。 * @param timestamp 要添加的时间戳值。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int add_timestamp(uint32_t row_index, int64_t timestamp); /** * @brief 模板函数,用于向指定的行和列添加类型为 T 的值。 * * @tparam T 要添加的值的类型, 如 int32_t, int64_t, double, * float, bool, char*, std::tm. * @param row_index 要添加值的行索引, * 必须小于最大行数。 * @param schema_index 要添加的值对应的列模式索引。 * @param val 要添加的值。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ template <typename T> int add_value(uint32_t row_index, uint32_t schema_index, T val); /** * @brief 模板函数,用于通过列名向指定的行和列添加类型为 T 的值。 * * @tparam T 要添加的值的类型, 如 int32_t, int64_t, double, * float, bool, char*, std::tm. * @param row_index 要添加值的行索引, * 必须小于最大行数。 * @param measurement_name 要添加值的列名, * 必须与构造时提供的列名之一匹配。 * @param val 要添加的值。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ template <typename T> int add_value(uint32_t row_index, const std::string &measurement_name, T val); };
/** * @brief TsFileReader 提供了查询所有以 .tsfile 为后缀的文件的能力。 * * TsFileReader 旨在用于查询 .tsfile 文件,它支持树模型查询和表模型查询, * 并支持查询元数据信息,如 TableSchema 和 TimeseriesSchema。 */ class TsFileReader { public: TsFileReader(); ~TsFileReader(); /** * @brief 打开 tsfile 文件。 * * @param file_path 要打开的 tsfile 文件路径。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int open(const std::string &file_path); /** * @brief 关闭 tsfile,查询完成后应调用此方法。 * * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int close(); /** * @brief 通过查询表达式对 tsfile 进行查询,用户可以自行构造查询表达式来查询 tsfile。 * * @param [in] qe 查询表达式。 * @param [out] ret_qds 查询结果集。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int query(storage::QueryExpression *qe, ResultSet *&ret_qds); /** * @brief 通过路径列表、起始时间和结束时间查询 tsfile, * 本方法使用树模型进行查询。 * * @param [in] path_list 路径列表。 * @param [in] start_time 起始时间。 * @param [in] end_time 结束时间。 * @param [out] result_set 查询结果集。 */ int query(std::vector<std::string> &path_list, int64_t start_time, int64_t end_time, ResultSet *&result_set); /** * @brief 通过表名、列名、起始时间和结束时间查询 tsfile, * 本方法使用表模型进行查询。 * * @param [in] table_name 表名。 * @param [in] columns_names 列名列表。 * @param [in] start_time 起始时间。 * @param [in] end_time 结束时间。 * @param [out] result_set 查询结果集。 */ int query(const std::string &table_name, const std::vector<std::string> &columns_names, int64_t start_time, int64_t end_time, ResultSet *&result_set); /** * @brief 通过表名、列名、开始时间、结束时间和标签过滤器查询 tsfile。 * 此方法用于通过表模型查询 tsfile。 * * @param [in] table_name 表名 * @param [in] columns_names 列名 * @param [in] start_time 开始时间 * @param [in] end_time 结束时间 * @param [in] tag_filter 标签过滤器 * @param [out] result_set 结果集 */ int query(const std::string& table_name, const std::vector<std::string>& columns_names, int64_t start_time, int64_t end_time, ResultSet*& result_set, Filter* tag_filter); /** * @brief 销毁结果集,该方法应在查询完成并使用完 result_set 后调用。 * * @param qds 查询结果集。 */ void destroy_query_data_set(ResultSet *qds); ResultSet *read_timeseries( const std::shared_ptr<IDeviceID> &device_id, const std::vector<std::string> &measurement_name); /** * @brief 获取 tsfile 中的所有设备。 * * @param table_name 表名。 * @return std::vector<std::shared_ptr<IDeviceID>> 设备 ID 列表。 */ std::vector<std::shared_ptr<IDeviceID>> get_all_devices( std::string table_name); /** * @brief 根据设备 ID 和测量名称获取时间序列模式信息。 * * @param [in] device_id 设备 ID。 * @param [out] result std::vector<MeasurementSchema> 测量模式列表。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ int get_timeseries_schema(std::shared_ptr<IDeviceID> device_id, std::vector<MeasurementSchema> &result); /** * @brief 根据表名获取表的模式信息。 * * @param table_name 表名。 * @return std::shared_ptr<TableSchema> 表的模式信息。 */ std::shared_ptr<TableSchema> get_table_schema( const std::string &table_name); /** * @brief 获取 tsfile 中所有表的模式信息。 * * @return std::vector<std::shared_ptr<TableSchema>> 表模式信息列表。 */ std::vector<std::shared_ptr<TableSchema>> get_all_table_schemas(); };
/** * @brief ResultSet 是 TsFileReader 的查询结果集,用于访问查询结果。 * * ResultSet 是一个虚类,使用时应转换为相应的实现类。 * @note 当使用树模型且过滤器是全局时间过滤器时,应转换为 QDSWithoutTimeGenerator。 * @note 当使用树模型但过滤器不是全局时间过滤器时,应转换为 QDSWithTimeGenerator。 * @note 如果查询使用的是表模型,则应转换为 TableResultSet。 */ class ResultSet { public: ResultSet() {} virtual ~ResultSet() {} /** * @brief 获取结果集的下一行。 * * @param[out] has_next 布尔值,指示是否还有下一行。 * @return 成功时返回 0,失败时返回 errno_define.h 中的非零错误码。 */ virtual int next(bool& has_next) = 0; /** * @brief 根据列名检查该列的值是否为 null。 * * @param column_name 列名。 * @return 如果值为 null 返回 true,否则返回 false。 */ virtual bool is_null(const std::string& column_name) = 0; /** * @brief 根据列索引检查该列的值是否为 null。 * * @param column_index 从 1 开始的列索引。 * @return 如果值为 null 返回 true,否则返回 false。 */ virtual bool is_null(uint32_t column_index) = 0; /** * @brief 根据列名获取该列的值。 * * @param column_name 列名。 * @return 该列的值。 */ template <typename T> T get_value(const std::string& column_name); /** * @brief 根据列索引获取该列的值。 * * @param column_index 从 1 开始的列索引。 * @return 该列的值。 */ template <typename T> T get_value(uint32_t column_index); /** * @brief 获取当前行的 RowRecord。 * * @return 当前行的 RowRecord。 */ virtual RowRecord* get_row_record() = 0; /** * @brief 获取结果集的元数据。 * * @return std::shared_ptr<ResultSetMetadata> 结果集的元数据。 */ virtual std::shared_ptr<ResultSetMetadata> get_metadata() = 0; /** * @brief 关闭结果集。 * * @note 当不再需要结果集时应调用此方法。 */ virtual void close() = 0; };
/** * @brief 结果集的元数据信息。 * * 用户可以通过 ResultSetMetadata 获取结果集的元数据, * 包括所有列名和数据类型。当用户使用表模型时,第一列默认是时间列。 */ class ResultSetMetadata { public: /** * @brief ResultSetMetadata 的构造函数。 * * @param column_names 列名列表。 * @param column_types 列类型列表。 */ ResultSetMetadata(const std::vector<std::string>& column_names, const std::vector<common::TSDataType>& column_types); /** * @brief 获取指定索引的列类型。 * * @param column_index 从 1 开始的列索引。 * @return 对应的列类型。 */ common::TSDataType get_column_type(uint32_t column_index); /** * @brief 获取指定索引的列名。 * * @param column_index 从 1 开始的列索引。 * @return 对应的列名。 */ std::string get_column_name(uint32_t column_index); /** * @brief 获取列的总数量。 * * @return 列的数量(uint32_t 类型)。 */ uint32_t get_column_count(); };
用于构建基于Tag的过滤器以查询数据
class TagFilterBuilder { public: explicit TagFilterBuilder(TableSchema* schema); Filter* eq(const std::string& columnName, const std::string& value); Filter* neq(const std::string& columnName, const std::string& value); Filter* lt(const std::string& columnName, const std::string& value); Filter* lteq(const std::string& columnName, const std::string& value); Filter* gt(const std::string& columnName, const std::string& value); Filter* gteq(const std::string& columnName, const std::string& value); Filter* reg_exp(const std::string& columnName, const std::string& value); Filter* not_reg_exp(const std::string& columnName, const std::string& value); Filter* between_and(const std::string& columnName, const std::string& lower, const std::string& upper); Filter* not_between_and(const std::string& columnName, const std::string& lower, const std::string& upper); // 逻辑操作 static Filter* and_filter(Filter* left, Filter* right); static Filter* or_filter(Filter* left, Filter* right); static Filter* not_filter(Filter* filter); };