docs/zh/SystemDesign/StorageEngine/MergeManager.md - iotdb - Git at Google

 <!--

     Licensed to the Apache Software Foundation (ASF) under one
     or more contributor license agreements.  See the NOTICE file
     distributed with this work for additional information
     regarding copyright ownership.  The ASF licenses this file
     to you under the Apache License, Version 2.0 (the
     "License"); you may not use this file except in compliance
     with the License.  You may obtain a copy of the License at

         http://www.apache.org/licenses/LICENSE-2.0

     Unless required by applicable law or agreed to in writing,
     software distributed under the License is distributed on an
     "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
     KIND, either express or implied.  See the License for the
     specific language governing permissions and limitations
     under the License.

 -->

 # 文件合并机制

 ## 设计原理

 写入的文件既有乱序的也有顺序的，既有小文件也有大文件，并且在不同系统中有不同的最佳合并算法，

 故 MergeManager 提供多种合并策略接口，并提供灵活的新策略接入方式

 ## 调用过程

 - 每一次 merge 会在用户 client 调用"merge"命令或根据配置中的 mergeIntervalSec 定时进行
 - merge 分为三个过程，包括选择文件(selector)，进行 merge ，以及 merge 过程中断后的恢复(recover)
 <img style="width:100%; max-width:800px; max-height:600px; margin-left:auto; margin-right:auto; display:block;" src="https://user-images.githubusercontent.com/24886743/75313978-6c64b000-5899-11ea-8565-40b012f9c8a2.png">

 ## 合并的例子

 在 squeeze 合并策略下，当一系列的 seq 以及 unseq 文件进行合并，且并未超过时间及内存限制时，所有文件都将合并为一个命名为{时间戳}-{版本}-{merge次数+1}.tsfile.merge.squeeze的文件

 当超出了时间或内存限制，文件选择过程将被中断，当前已被选中的 seq 以及 unseq 文件则会进行如上合并形成一个文件

 时间限制是指在选择文件过程中花费的时间不能超过一个给定值，而非对合并过程耗时的估计，目的是防止文件过多时选择文件花费太多时间

 内存限制是指对已经被选择的文件在进行合并时消耗的最大内存进行估计，并使该估计值不会超过一个给定值，从而方式合并过程产生内存溢出。

 恢复的时候有两种选择，一个是接着之前的进度继续进行，另一个是放弃之前的进度

 ## 相关代码

 * org.apache.iotdb.db.engine.merge.BaseFileSelector

     文件选择过程的基类，规定了选择文件的基本框架，及在不同情况下计算文件内存消耗的方法，所有自定义的文件选择策略均需继承此类

 * org.apache.iotdb.db.engine.merge.IRecoverMergeTask

     recover 过程的接口类，规定了 recoverMerge 接口，所有自定义的merge恢复策略均需继承此类

 此外，每一个自定义的MergeTask均需继承Callable\<void\>接口，以保证可以被回调

 * org.apache.iotdb.db.engine.merge.manage.MergeContext

     Merge 过程中的公用上下文类

 * org.apache.iotdb.db.engine.merge.manage.MergeManager

     Merge 过程中的线程池类，管理了多个 merge task 的运行

 * org.apache.iotdb.db.engine.merge.manage.MergeResource

     Merge 过程中的资源类，负责管理 merge 过程中的 files,readers,writers,measurementSchemas,modifications 等资源

 ## inplace策略

 ### selector

 在受限的内存和时间下，先依次选择 unseq 文件，每次直接根据 unseq 文件的时间范围选择与之重叠的 seq 文件

 ### merge

 首先根据 storageGroupName 选出所有需要 merge 的 series ，然后针对 selector 中选出的每一个 seq 文件建立 chunkMetaHeap ,并根据配置中的 mergeChunkSubThreadNum 分多个子线程进行合并

 ## squeeze策略

 ### selector

 在受限的内存和时间下，先依次选择 unseq 文件，每次根据 unseq 文件的时间范围选择与之重叠的seq文件，然后按次序重试每一个 seq 文件，尽可能在内存和时间受限的情况下多取一些 seq 文件

 ### merge

 基本与 inplace 策略类似，首先根据 storageGroupName 选出所有需要 merge 的 series ，然后针对 selector 中选出的每一个 seq 文件建立 chunkMetaHeap ,并根据配置中的 mergeChunkSubThreadNum 分多个子线程进行合并

 ## merge中断后的恢复

 merge 在系统突然关闭或者出现故障时，可能会被强行中断，此时系统会记录下被中断的 merge 并在下一次 StorageGroupProcessor 被创建时扫描 merge.log 文件，根据配置进行重新 merge，也就是 recover 过程

 merge 会有以下几个状态，其中恢复过程均为优先放弃合并策略

 ### NONE
 基本什么都没干
 恢复时直接删除相应的 merge log，以等待下一次的手动或自动 merge

 ### MERGE_START
 将要合并的文件以及 timeseries 已经被选出
 恢复时删除对应的 merge 文件，清空选出的文件，对其他 merge 相关公用资源均做清空操作

 ### ALL_TS_MERGED
 所有的 timeseries 已经被合并
 恢复时直接进行 cleanUp ，并执行 merge 完成的回调操作

 ### MERGE_END
 表面所有的文件已经被合并，此次merge已经完成
 原则上不会在 merge log 中出现此状态
	<!--

	Licensed to the Apache Software Foundation (ASF) under one
	or more contributor license agreements. See the NOTICE file
	distributed with this work for additional information
	regarding copyright ownership. The ASF licenses this file
	to you under the Apache License, Version 2.0 (the
	"License"); you may not use this file except in compliance
	with the License. You may obtain a copy of the License at

	http://www.apache.org/licenses/LICENSE-2.0

	Unless required by applicable law or agreed to in writing,
	software distributed under the License is distributed on an
	"AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
	KIND, either express or implied. See the License for the
	specific language governing permissions and limitations
	under the License.

	-->

	# 文件合并机制

	## 设计原理

	写入的文件既有乱序的也有顺序的，既有小文件也有大文件，并且在不同系统中有不同的最佳合并算法，

	故 MergeManager 提供多种合并策略接口，并提供灵活的新策略接入方式

	## 调用过程

	- 每一次 merge 会在用户 client 调用"merge"命令或根据配置中的 mergeIntervalSec 定时进行
	- merge 分为三个过程，包括选择文件(selector)，进行 merge ，以及 merge 过程中断后的恢复(recover)
	<img style="width:100%; max-width:800px; max-height:600px; margin-left:auto; margin-right:auto; display:block;" src="https://user-images.githubusercontent.com/24886743/75313978-6c64b000-5899-11ea-8565-40b012f9c8a2.png">

	## 合并的例子

	在 squeeze 合并策略下，当一系列的 seq 以及 unseq 文件进行合并，且并未超过时间及内存限制时，所有文件都将合并为一个命名为{时间戳}-{版本}-{merge次数+1}.tsfile.merge.squeeze的文件

	当超出了时间或内存限制，文件选择过程将被中断，当前已被选中的 seq 以及 unseq 文件则会进行如上合并形成一个文件

	时间限制是指在选择文件过程中花费的时间不能超过一个给定值，而非对合并过程耗时的估计，目的是防止文件过多时选择文件花费太多时间

	内存限制是指对已经被选择的文件在进行合并时消耗的最大内存进行估计，并使该估计值不会超过一个给定值，从而方式合并过程产生内存溢出。

	恢复的时候有两种选择，一个是接着之前的进度继续进行，另一个是放弃之前的进度

	## 相关代码

	* org.apache.iotdb.db.engine.merge.BaseFileSelector

	文件选择过程的基类，规定了选择文件的基本框架，及在不同情况下计算文件内存消耗的方法，所有自定义的文件选择策略均需继承此类

	* org.apache.iotdb.db.engine.merge.IRecoverMergeTask

	recover 过程的接口类，规定了 recoverMerge 接口，所有自定义的merge恢复策略均需继承此类

	此外，每一个自定义的MergeTask均需继承Callable\<void\>接口，以保证可以被回调

	* org.apache.iotdb.db.engine.merge.manage.MergeContext

	Merge 过程中的公用上下文类

	* org.apache.iotdb.db.engine.merge.manage.MergeManager

	Merge 过程中的线程池类，管理了多个 merge task 的运行

	* org.apache.iotdb.db.engine.merge.manage.MergeResource

	Merge 过程中的资源类，负责管理 merge 过程中的 files,readers,writers,measurementSchemas,modifications 等资源

	## inplace策略

	### selector

	在受限的内存和时间下，先依次选择 unseq 文件，每次直接根据 unseq 文件的时间范围选择与之重叠的 seq 文件

	### merge

	首先根据 storageGroupName 选出所有需要 merge 的 series ，然后针对 selector 中选出的每一个 seq 文件建立 chunkMetaHeap ,并根据配置中的 mergeChunkSubThreadNum 分多个子线程进行合并

	## squeeze策略

	### selector

	在受限的内存和时间下，先依次选择 unseq 文件，每次根据 unseq 文件的时间范围选择与之重叠的seq文件，然后按次序重试每一个 seq 文件，尽可能在内存和时间受限的情况下多取一些 seq 文件

	### merge

	基本与 inplace 策略类似，首先根据 storageGroupName 选出所有需要 merge 的 series ，然后针对 selector 中选出的每一个 seq 文件建立 chunkMetaHeap ,并根据配置中的 mergeChunkSubThreadNum 分多个子线程进行合并

	## merge中断后的恢复

	merge 在系统突然关闭或者出现故障时，可能会被强行中断，此时系统会记录下被中断的 merge 并在下一次 StorageGroupProcessor 被创建时扫描 merge.log 文件，根据配置进行重新 merge，也就是 recover 过程

	merge 会有以下几个状态，其中恢复过程均为优先放弃合并策略

	### NONE
	基本什么都没干
	恢复时直接删除相应的 merge log，以等待下一次的手动或自动 merge

	### MERGE_START
	将要合并的文件以及 timeseries 已经被选出
	恢复时删除对应的 merge 文件，清空选出的文件，对其他 merge 相关公用资源均做清空操作

	### ALL_TS_MERGED
	所有的 timeseries 已经被合并
	恢复时直接进行 cleanUp ，并执行 merge 完成的回调操作

	### MERGE_END
	表面所有的文件已经被合并，此次merge已经完成
	原则上不会在 merge log 中出现此状态