TsFile 写流程

  • org.apache.iotdb.tsfile.write.*

TsFile 的写入流程如下图所示:

其中,每个设备对应一个 ChunkGroupWriter,每个传感器对应一个 ChunkWriter。

文件的写入主要分为三种操作,在图上用 1、2、3 标注

  • 1、写内存换冲区
  • 2、持久化 ChunkGroup
  • 3、关闭文件

1、写内存缓冲区

TsFile 文件层的写入接口有两种

  • TsFileWriter.write(TSRecord record)

写入一个设备一个时间戳多个测点。

  • TsFileWriter.write(Tablet tablet)

写入一个设备多个时间戳多个测点。

当调用 write 接口时,这个设备的数据会交给对应的 ChunkGroupWriter,其中的每个测点会交给对应的 ChunkWriter 进行写入。ChunkWriter 完成编码和打包(生成 Page)。

2、持久化 ChunkGroup

  • TsFileWriter.flushAllChunkGroups()

当内存中的数据达到一定阈值,会触发持久化操作。每次持久化会把当前内存中所有设备的数据全部持久化到磁盘的 TsFile 文件中。每个设备对应一个 ChunkGroup,每个测点对应一个 Chunk。

持久化完成后会在内存中缓存对应的元数据信息,以供查询和生成文件尾部 metadata。

3、关闭文件

  • TsFileWriter.close()

根据内存中缓存的元数据,生成 TsFileMetadata 追加到文件尾部(TsFileWriter.flushMetadataIndex()),最后关闭文件。

生成 TsFileMetadata 的过程中比较重要的一步是建立元数据索引 (MetadataIndex) 树。正如我们提到过的,元数据索引采用树形结构进行设计的目的是在设备数或者传感器数量过大时,可以不用一次读取所有的 TimeseriesMetadata,只需要根据所读取的传感器定位对应的节点,从而减少 I/O,加快查询速度。以下是建立元数据索引树的详细算法和过程:

  • org.apache.iotdb.tsfile.file.metadata.MetadataIndexConstructor

MetadataIndexConstructor.constructMetadataIndex()

方法的输入包括:

  • Map<String, List<TimeseriesMetadata>> deviceTimeseriesMetadataMap,表示设备到其 TimeseriesMetadata 列表的映射
  • TsFileOutput out,是包装好的 TsFile output

整个方法分成三大部分:

  1. 在传感器索引层级,把 deviceTimeseriesMetadataMap 中的每一个设备及其 TimeseriesMetadata 列表,转化为 MetadataIndexNode 并放进 deviceMetadataIndexMap 中。具体来说,对于每一个设备:
  • 初始化此设备的索引节点的队列 queue
  • 初始化传感器索引层级的叶子节点 currentIndexNode ,类型为 LEAF_MEASUREMENT
  • 对于每个 TimeseriesMetadata:
    • 序列化
    • 每隔 MAX_DEGREE_OF_INDEX_NODE 个,加一条 entry 到 currentIndexNode
    • 每当 currentIndexNode 中攒够 MAX_DEGREE_OF_INDEX_NODE 个 entry 后,将 currentIndexNode 加入 queue 中,并将 currentIndexNode 指向一个新的 MetadataIndexNode
  • 根据 queue 中已经存储的叶子节点,逐层生成上层节点,直至最终的根节点(此方法解析见下),并将“设备-根节点”对应的映射加入 deviceMetadataIndexMap
  1. 接下来,判断设备数是否超过 MAX_DEGREE_OF_INDEX_NODE,如果未超过则可以直接形成元数据索引树的根节点并返回
  • 初始化元数据索引树的根节点 metadataIndexNode,类型为 INTERNAL_MEASUREMENT
  • 对于 deviceMetadataIndexMap 中的每一个 entry:
    • 序列化
    • 将其转化成一个索引项,加入到 metadataIndexNode
  • 设置根节点的 endOffset 并返回
  1. 如果设备数超过 MAX_DEGREE_OF_INDEX_NODE,则需要形成元数据索引树的设备索引层级
  • 初始化存放设备索引层级节点的队列 queue
  • 初始化设备索引层级的叶子节点 currentIndexNode ,类型为 LEAF_DEVICE
  • 对于 deviceMetadataIndexMap 中的每一个 entry:
    • 序列化
    • 将其转化成一个索引项,加入到 metadataIndexNode
    • 每当 currentIndexNode 中攒够 MAX_DEGREE_OF_INDEX_NODE 个 entry 后,将 currentIndexNode 加入 queue 中,并将 currentIndexNode 指向一个新的 MetadataIndexNode
  • 根据 queue 中已经存储的叶子节点,逐层生成上层节点,直至最终的根节点(此方法解析见下)
  • 设置根节点的 endOffset 并返回

MetadataIndexConstructor.generateRootNode

方法的输入包括:

  • Queue<MetadataIndexNode> metadataIndexNodeQueue,是放有 MetadataIndexNode 的队列
  • TsFileOutput out,是包装好的 TsFile output
  • MetadataIndexNodeType type,是所形成的树的内部节点的类型,有两种:在传感器索引层级调用时,传入 INTERNAL_MEASUREMENT;在设备索引层级调用时,传入 INTERNAL_DEVICE

该方法需要将队列中的 MetadataIndexNode 形成树级结构,并返回根节点:

  1. 根据需要的类型 type 初始化 currentIndexNode
  2. 当队列中有多余一个节点时,循环处理队列,对于队列中存在的每个节点:
  • 序列化
  • 将其转化成一个索引项,加入到 currentIndexNode
  • 每当 currentIndexNode 中攒够 MAX_DEGREE_OF_INDEX_NODE 个 entry 后,将 currentIndexNode 加入 queue 中,并将 currentIndexNode 指向一个新的 MetadataIndexNode
  1. 队列中只剩下一个节点时,返回队列中最终剩余的根节点

MetadataIndexConstructor.addCurrentIndexNodeToQueue

方法的输入包括:

  • MetadataIndexNode currentIndexNode,是当前需要加入队列的 MetadataIndexNode
  • Queue<MetadataIndexNode> metadataIndexNodeQueue,是放有 MetadataIndexNode 的队列
  • TsFileOutput out,是包装好的 TsFile output

该方法直接设定当前节点的 endOffset,并将该节点加入队列中。