| </code></pre><div class="line-numbers" aria-hidden="true"><div class="line-number"></div></div></div><p>报错分析:<br> datanode_memory_proportion参数控制分给查询的内存,chunk_timeseriesmeta_free_memory_proportion参数控制查询执行可用的内存。<br> 默认情况下分给查询的内存为堆内存*30%,查询执行可用的内存为查询内存的20%。<br> 报错显示当前剩余查询执行可用内存为86762854B=82.74MB,该查询预估使用执行内存270139392B=257.6MB。</p><p>一些可能的改进项:</p><ul><li>在不改变默认参数的前提下,调大IoTDB的堆内存大于 4.2G(4.2G * 1024MB=4300MB),4300M*30%*20%=258M>257.6M,可以满足要求。</li><li>更改 datanode_memory_proportion 等参数,使查询执行可用内存>257.6MB。</li><li>减少导出的时间序列数量。</li><li>给查询语句添加 slimit 限制,也是减少查询时间序列的一种方案。</li><li>添加 align by device,会按照device顺序进行输出,内存占用会降低至单device级别。</li></ul><h2 id="分布式部署-faq" tabindex="-1"><a class="header-anchor" href="#分布式部署-faq"><span>分布式部署 FAQ</span></a></h2><h3 id="集群启停" tabindex="-1"><a class="header-anchor" href="#集群启停"><span>集群启停</span></a></h3><h4 id="_1-confignode初次启动失败-如何排查原因" tabindex="-1"><a class="header-anchor" href="#_1-confignode初次启动失败-如何排查原因"><span>1. ConfigNode初次启动失败,如何排查原因?</span></a></h4><ul><li>ConfigNode初次启动时确保已清空data/confignode目录</li><li>确保该ConfigNode使用到的<IP+端口>没有被占用,没有与已启动的ConfigNode使用到的<IP+端口>冲突</li><li>确保该ConfigNode的cn_target_confignode_list(指向存活的ConfigNode;如果该ConfigNode是启动的第一个ConfigNode,该值指向自身)配置正确</li><li>确保该ConfigNode的配置项(共识协议、副本数等)等与cn_target_confignode_list对应的ConfigNode集群一致</li></ul><h4 id="_2-confignode初次启动成功-show-cluster的结果里为何没有该节点" tabindex="-1"><a class="header-anchor" href="#_2-confignode初次启动成功-show-cluster的结果里为何没有该节点"><span>2. ConfigNode初次启动成功,show cluster的结果里为何没有该节点?</span></a></h4><ul><li>检查cn_target_confignode_list是否正确指向了正确的地址; 如果cn_target_confignode_list指向了自身,则会启动一个新的ConfigNode集群</li></ul><h4 id="_3-datanode初次启动失败-如何排查原因" tabindex="-1"><a class="header-anchor" href="#_3-datanode初次启动失败-如何排查原因"><span>3. DataNode初次启动失败,如何排查原因?</span></a></h4><ul><li>DataNode初次启动时确保已清空data/datanode目录。 如果启动结果为“Reject DataNode restart.”则表示启动时可能没有清空data/datanode目录</li><li>确保该DataNode使用到的<IP+端口>没有被占用,没有与已启动的DataNode使用到的<IP+端口>冲突</li><li>确保该DataNode的dn_target_confignode_list指向存活的ConfigNode</li></ul><h4 id="_4-移除datanode执行失败-如何排查" tabindex="-1"><a class="header-anchor" href="#_4-移除datanode执行失败-如何排查"><span>4. 移除DataNode执行失败,如何排查?</span></a></h4>`,30),_=e("li",null,"检查remove-datanode脚本的参数是否正确,是否传入了正确的ip:port或正确的dataNodeId",-1),m=e("li",null,"只有集群可用节点数量 > max(元数据副本数量, 数据副本数量)时,移除操作才允许被执行",-1),v=e("li",null,"执行移除DataNode的过程会将该DataNode上的数据迁移到其他存活的DataNode,数据迁移以Region为粒度,如果某个Region迁移失败,则被移除的DataNode会一直处于Removing状态",-1),b={href:"http://xn--IoTDBremove-datanode-f055at3i1sdn52bz2aw07gus4dzw4i.sh",target:"_blank",rel:"noopener noreferrer"},f=i('<h4 id="_5-挂掉的datanode是否支持移除" tabindex="-1"><a class="header-anchor" href="#_5-挂掉的datanode是否支持移除"><span>5. 挂掉的DataNode是否支持移除?</span></a></h4><ul><li>当前集群副本数量大于1时可以移除。 如果集群副本数量等于1,则不支持移除。 在下个版本会推出强制移除的命令</li></ul><h4 id="_6-从0-13升级到1-0需要注意什么" tabindex="-1"><a class="header-anchor" href="#_6-从0-13升级到1-0需要注意什么"><span>6. 从0.13升级到1.0需要注意什么?</span></a></h4><ul><li>0.13版本与1.0版本的文件目录结构是不同的,不能将0.13的data目录直接拷贝到1.0集群使用。如果需要将0.13的数据导入至1.0,可以使用LOAD功能</li><li>0.13版本的默认RPC地址是0.0.0.0,1.0版本的默认RPC地址是127.0.0.1</li></ul><h3 id="集群重启" tabindex="-1"><a class="header-anchor" href="#集群重启"><span>集群重启</span></a></h3><h4 id="_1-如何重启集群中的某个confignode" tabindex="-1"><a class="header-anchor" href="#_1-如何重启集群中的某个confignode"><span>1. 如何重启集群中的某个ConfigNode?</span></a></h4><ul><li>第一步:通过stop-confignode.sh或kill进程方式关闭ConfigNode进程</li><li>第二步:通过执行start-confignode.sh启动ConfigNode进程实现重启</li><li>下个版本IoTDB会提供一键重启的操作</li></ul><h4 id="_2-如何重启集群中的某个datanode" tabindex="-1"><a class="header-anchor" href="#_2-如何重启集群中的某个datanode"><span>2. 如何重启集群中的某个DataNode?</span></a></h4><ul><li>第一步:通过stop-datanode.sh或kill进程方式关闭DataNode进程</li><li>第二步:通过执行start-datanode.sh启动DataNode进程实现重启</li><li>下个版本IoTDB会提供一键重启的操作</li></ul><h4 id="_3-将某个confignode移除后-remove-confignode-能否再利用该confignode的data目录重启" tabindex="-1"><a class="header-anchor" href="#_3-将某个confignode移除后-remove-confignode-能否再利用该confignode的data目录重启"><span>3. 将某个ConfigNode移除后(remove-confignode),能否再利用该ConfigNode的data目录重启?</span></a></h4><ul><li>不能。会报错:Reject ConfigNode restart. Because there are no corresponding ConfigNode(whose nodeId=xx) in the cluster.</li></ul><h4 id="_4-将某个datanode移除后-remove-datanode-能否再利用该datanode的data目录重启" tabindex="-1"><a class="header-anchor" href="#_4-将某个datanode移除后-remove-datanode-能否再利用该datanode的data目录重启"><span>4. 将某个DataNode移除后(remove-datanode),能否再利用该DataNode的data目录重启?</span></a></h4><ul><li>不能正常重启,启动结果为“Reject DataNode restart. Because there are no corresponding DataNode(whose nodeId=xx) in the cluster. Possible solutions are as follows:...”</li></ul>',13),x={id:"_5-用户看到某个confignode-datanode变成了unknown状态-在没有kill对应进程的情况下-直接删除掉confignode-datanode对应的data目录-然后执行start-confignode-sh-start-datanode-sh-这种情况下能成功吗",tabindex:"-1"},D={class:"header-anchor",href:"#_5-用户看到某个confignode-datanode变成了unknown状态-在没有kill对应进程的情况下-直接删除掉confignode-datanode对应的data目录-然后执行start-confignode-sh-start-datanode-sh-这种情况下能成功吗"},B={href:"http://xn--start-confignode-p301a820q612chrvf.sh/start-datanode.sh%EF%BC%8C%E8%BF%99%E7%A7%8D%E6%83%85%E5%86%B5%E4%B8%8B%E8%83%BD%E6%88%90%E5%8A%9F%E5%90%97",target:"_blank",rel:"noopener noreferrer"},I=i('<ul><li>无法启动成功,会报错端口已被占用</li></ul><h3 id="集群运维" tabindex="-1"><a class="header-anchor" href="#集群运维"><span>集群运维</span></a></h3><h4 id="_1-show-cluster执行失败-显示-please-check-server-status-如何排查" tabindex="-1"><a class="header-anchor" href="#_1-show-cluster执行失败-显示-please-check-server-status-如何排查"><span>1. Show cluster执行失败,显示“please check server status”,如何排查?</span></a></h4><ul><li>确保ConfigNode集群一半以上的节点处于存活状态</li><li>确保客户端连接的DataNode处于存活状态</li></ul><h4 id="_2-某一datanode节点的磁盘文件损坏-如何修复这个节点" tabindex="-1"><a class="header-anchor" href="#_2-某一datanode节点的磁盘文件损坏-如何修复这个节点"><span>2. 某一DataNode节点的磁盘文件损坏,如何修复这个节点?</span></a></h4><ul><li>当前只能通过remove-datanode的方式进行实现。remove-datanode执行的过程中会将该DataNode上的数据迁移至其他存活的DataNode节点(前提是集群设置的副本数大于1)</li><li>下个版本IoTDB会提供一键修复节点的功能</li></ul><h4 id="_3-如何降低confignode、datanode使用的内存" tabindex="-1"><a class="header-anchor" href="#_3-如何降低confignode、datanode使用的内存"><span>3. 如何降低ConfigNode、DataNode使用的内存?</span></a></h4><ul><li>在conf/confignode-env.sh、conf/datanode-env.sh文件可通过调整ON_HEAP_MEMORY、OFF_HEAP_MEMORY等选项可以调整ConfigNode、DataNode使用的最大堆内、堆外内存</li></ul>',8);function T(k,N){const t=d("ExternalLinkIcon");return s(),l("div",null,[c,e("p",null,[a("是的。IoTDB 与开源生态紧密结合。IoTDB 支持 "),e("a",h,[a("Hadoop"),n(t)]),a(", "),e("a",p,[a("Spark"),n(t)]),a(" 和 "),e("a",u,[a("Grafana"),n(t)]),a(" 可视化工具。")]),g,e("ul",null,[_,m,v,e("li",null,[a("补充:处于Removing状态的节点,其节点上的Region也是Removing或Unknown状态,即不可用状态。 该Remvoing状态的节点也不会接受客户端的请求。如果要使Removing状态的节点变为可用,用户可以使用set system status to running 命令将该节点设置为Running状态;如果要使迁移失败的Region处于可用状态,可以使用migrate region from datanodeId1 to datanodeId2 命令将该不可用的Region迁移到其他存活的节点。"),e("a",b,[a("另外IoTDB后续也会提供remove-datanode.sh"),n(t)]),a(" -f命令,来强制移除节点(迁移失败的Region会直接丢弃)")])]),f,e("h4",x,[e("a",D,[e("span",null,[a("5. 用户看到某个ConfigNode/DataNode变成了Unknown状态,在没有kill对应进程的情况下,直接删除掉ConfigNode/DataNode对应的data目录,"),e("a",B,[a("然后执行start-confignode.sh/start-datanode.sh,这种情况下能成功吗"),n(t)]),a("?")])])]),I])}const w=o(r,[["render",T],["__file","Frequently-asked-questions.html.vue"]]),E=JSON.parse('{"path":"/zh/UserGuide/V1.2.x/FAQ/Frequently-asked-questions.html","title":"常见问题","lang":"zh-CN","frontmatter":{"description":"常见问题 一般问题 1. 如何查询我的IoTDB版本? 有几种方法可以识别您使用的 IoTDB 版本: 启动 IoTDB 的命令行界面: 检查 pom.xml 文件: 使用 JDBC API: 使用命令行接口: 2. 在哪里可以找到IoTDB的日志? 假设您的根目录是: 假如 $IOTDB_HOME = /workspace/iotdb/server/...","head":[["link",{"rel":"alternate","hreflang":"en-us","href":"https://iotdb.apache.org/UserGuide/V1.2.x/FAQ/Frequently-asked-questions.html"}],["meta",{"property":"og:url","content":"https://iotdb.apache.org/zh/UserGuide/V1.2.x/FAQ/Frequently-asked-questions.html"}],["meta",{"property":"og:site_name","content":"IoTDB Website"}],["meta",{"property":"og:title","content":"常见问题"}],["meta",{"property":"og:description","content":"常见问题 一般问题 1. 如何查询我的IoTDB版本? 有几种方法可以识别您使用的 IoTDB 版本: 启动 IoTDB 的命令行界面: 检查 pom.xml 文件: 使用 JDBC API: 使用命令行接口: 2. 在哪里可以找到IoTDB的日志? 假设您的根目录是: 假如 $IOTDB_HOME = /workspace/iotdb/server/..."}],["meta",{"property":"og:type","content":"article"}],["meta",{"property":"og:locale","content":"zh-CN"}],["meta",{"property":"og:locale:alternate","content":"en-US"}],["meta",{"property":"og:updated_time","content":"2024-02-07T02:18:48.000Z"}],["meta",{"property":"article:modified_time","content":"2024-02-07T02:18:48.000Z"}],["script",{"type":"application/ld+json"},"{\\"@context\\":\\"https://schema.org\\",\\"@type\\":\\"Article\\",\\"headline\\":\\"常见问题\\",\\"image\\":[\\"\\"],\\"dateModified\\":\\"2024-02-07T02:18:48.000Z\\",\\"author\\":[]}"]]},"headers":[{"level":2,"title":"一般问题","slug":"一般问题","link":"#一般问题","children":[{"level":3,"title":"1. 如何查询我的IoTDB版本?","slug":"_1-如何查询我的iotdb版本","link":"#_1-如何查询我的iotdb版本","children":[]},{"level":3,"title":"2. 在哪里可以找到IoTDB的日志?","slug":"_2-在哪里可以找到iotdb的日志","link":"#_2-在哪里可以找到iotdb的日志","children":[]},{"level":3,"title":"3. 在哪里可以找到IoTDB的数据文件?","slug":"_3-在哪里可以找到iotdb的数据文件","link":"#_3-在哪里可以找到iotdb的数据文件","children":[]},{"level":3,"title":"4. 如何知道IoTDB中存储了多少时间序列?","slug":"_4-如何知道iotdb中存储了多少时间序列","link":"#_4-如何知道iotdb中存储了多少时间序列","children":[]},{"level":3,"title":"5. 可以使用Hadoop和Spark读取IoTDB中的TsFile吗?","slug":"_5-可以使用hadoop和spark读取iotdb中的tsfile吗","link":"#_5-可以使用hadoop和spark读取iotdb中的tsfile吗","children":[]},{"level":3,"title":"6. IoTDB如何处理重复的数据点?","slug":"_6-iotdb如何处理重复的数据点","link":"#_6-iotdb如何处理重复的数据点","children":[]},{"level":3,"title":"7. 我如何知道具体的timeseries的类型?","slug":"_7-我如何知道具体的timeseries的类型","link":"#_7-我如何知道具体的timeseries的类型","children":[]},{"level":3,"title":"8. 如何更改IoTDB的客户端时间显示格式?","slug":"_8-如何更改iotdb的客户端时间显示格式","link":"#_8-如何更改iotdb的客户端时间显示格式","children":[]},{"level":3,"title":"9. 怎么处理来自org.apache.ratis.grpc.server.GrpcLogAppender的IndexOutOfBoundsException?","slug":"_9-怎么处理来自org-apache-ratis-grpc-server-grpclogappender的indexoutofboundsexception","link":"#_9-怎么处理来自org-apache-ratis-grpc-server-grpclogappender的indexoutofboundsexception","children":[]},{"level":3,"title":"10. 预估内存不足报错如何处理?","slug":"_10-预估内存不足报错如何处理","link":"#_10-预估内存不足报错如何处理","children":[]}]},{"level":2,"title":"分布式部署 FAQ","slug":"分布式部署-faq","link":"#分布式部署-faq","children":[{"level":3,"title":"集群启停","slug":"集群启停","link":"#集群启停","children":[]},{"level":3,"title":"集群重启","slug":"集群重启","link":"#集群重启","children":[]},{"level":3,"title":"集群运维","slug":"集群运维","link":"#集群运维","children":[]}]}],"git":{"createdTime":1688958677000,"updatedTime":1707272328000,"contributors":[{"name":"wanghui42","email":"105700158+wanghui42@users.noreply.github.com","commits":2},{"name":"CritasWang","email":"critas@outlook.com","commits":1},{"name":"Lei","email":"33376433+LeiRui@users.noreply.github.com","commits":1}]},"readingTime":{"minutes":7.86,"words":2357},"filePathRelative":"zh/UserGuide/V1.2.x/FAQ/Frequently-asked-questions.md","localizedDate":"2023年7月10日","autoDesc":true}');export{w as comp,E as data}; |