be/src/vec/data_types/data_type_struct.cpp - doris - Git at Google

 // Licensed to the Apache Software Foundation (ASF) under one
 // or more contributor license agreements.  See the NOTICE file
 // distributed with this work for additional information
 // regarding copyright ownership.  The ASF licenses this file
 // to you under the Apache License, Version 2.0 (the
 // "License"); you may not use this file except in compliance
 // with the License.  You may obtain a copy of the License at
 //
 //   http://www.apache.org/licenses/LICENSE-2.0
 //
 // Unless required by applicable law or agreed to in writing,
 // software distributed under the License is distributed on an
 // "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
 // KIND, either express or implied.  See the License for the
 // specific language governing permissions and limitations
 // under the License.
 // This file is copied from
 // https://github.com/ClickHouse/ClickHouse/blob/master/src/DataTypes/DataTypeTuple.cpp
 // and modified by Doris

 #include "vec/data_types/data_type_struct.h"

 #include <ctype.h>
 #include <fmt/format.h>
 #include <gen_cpp/data.pb.h>
 #include <glog/logging.h>
 #include <string.h>

 #include <algorithm>
 #include <memory>
 #include <ostream>
 #include <typeinfo>
 #include <unordered_set>
 #include <utility>
 #include <vector>

 #include "vec/columns/column.h"
 #include "vec/columns/column_const.h"
 #include "vec/columns/column_nullable.h"
 #include "vec/columns/column_struct.h"
 #include "vec/common/assert_cast.h"
 #include "vec/common/string_buffer.hpp"
 #include "vec/common/string_ref.h"
 #include "vec/io/reader_buffer.h"

 namespace doris::vectorized {

 DataTypeStruct::DataTypeStruct(const DataTypes& elems_)
         : elems(elems_), have_explicit_names(false) {
     /// Automatically assigned names in form of '1', '2', ...
     size_t size = elems.size();
     names.resize(size);
     for (size_t i = 0; i < size; ++i) {
         names[i] = std::to_string(i + 1);
     }
 }

 static Status check_tuple_names(const Strings& names) {
     std::unordered_set<String> names_set;
     for (const auto& name : names) {
         if (name.empty()) {
             return Status::InvalidArgument("Names of tuple elements cannot be empty");
         }

         if (!names_set.insert(name).second) {
             return Status::InvalidArgument("Names of tuple elements must be unique");
         }
     }

     return {};
 }

 DataTypeStruct::DataTypeStruct(const DataTypes& elems_, const Strings& names_)
         : elems(elems_), names(names_), have_explicit_names(true) {
     size_t size = elems.size();
     if (names.size() != size) {
         LOG(FATAL) << "Wrong number of names passed to constructor of DataTypeStruct";
         __builtin_unreachable();
     }

     Status st = check_tuple_names(names);
 }

 std::string DataTypeStruct::do_get_name() const {
     size_t size = elems.size();
     std::stringstream s;

     s << "Struct(";
     for (size_t i = 0; i < size; ++i) {
         if (i != 0) {
             s << ", ";
         }
         s << names[i] << ":";
         s << elems[i]->get_name();
     }
     s << ")";

     return s.str();
 }

 Status DataTypeStruct::from_string(ReadBuffer& rb, IColumn* column) const {
     DCHECK(!rb.eof());
     auto* struct_column = assert_cast<ColumnStruct*>(column);

     if (*rb.position() != '{') {
         return Status::InvalidArgument("Struct does not start with '{}' character, found '{}'", "{",
                                        *rb.position());
     }
     if (*(rb.end() - 1) != '}') {
         return Status::InvalidArgument("Struct does not end with '{}' character, found '{}'", "}",
                                        *(rb.end() - 1));
     }

     // here need handle the empty struct '{}'
     if (rb.count() == 2) {
         for (size_t i = 0; i < struct_column->tuple_size(); ++i) {
             struct_column->get_column(i).insert_default();
         }
         return Status::OK();
     }

     ++rb.position();

     bool is_explicit_names = false;
     std::vector<std::string> field_names;
     std::vector<ReadBuffer> field_rbs;
     std::vector<size_t> field_pos;

     while (!rb.eof()) {
         StringRef slot(rb.position(), rb.count());
         bool has_quota = false;
         bool is_name = false;
         if (!DataTypeStructSerDe::next_slot_from_string(rb, slot, is_name, has_quota)) {
             return Status::InvalidArgument("Cannot read struct field from text '{}'",
                                            slot.to_string());
         }
         if (is_name) {
             std::string name = slot.to_string();
             if (!DataTypeStructSerDe::next_slot_from_string(rb, slot, is_name, has_quota)) {
                 return Status::InvalidArgument("Cannot read struct field from text '{}'",
                                                slot.to_string());
             }
             ReadBuffer field_rb(const_cast<char*>(slot.data), slot.size);
             field_names.push_back(name);
             field_rbs.push_back(field_rb);

             if (!is_explicit_names) {
                 is_explicit_names = true;
             }
         } else {
             ReadBuffer field_rb(const_cast<char*>(slot.data), slot.size);
             field_rbs.push_back(field_rb);
         }
     }

     // TODO: should we support insert default field value when actual field number is less than
     // schema field number?
     if (field_rbs.size() != elems.size()) {
         std::string cmp_str = field_rbs.size() > elems.size() ? "more" : "less";
         return Status::InvalidArgument(
                 "Actual struct field number {} is {} than schema field number {}.",
                 field_rbs.size(), cmp_str, elems.size());
     }

     if (is_explicit_names) {
         if (field_names.size() != field_rbs.size()) {
             return Status::InvalidArgument(
                     "Struct field name number {} is not equal to field number {}.",
                     field_names.size(), field_rbs.size());
         }
         std::unordered_set<std::string> name_set;
         for (size_t i = 0; i < field_names.size(); i++) {
             // check duplicate fields
             auto ret = name_set.insert(field_names[i]);
             if (!ret.second) {
                 return Status::InvalidArgument("Struct field name {} is duplicate with others.",
                                                field_names[i]);
             }
             // check name valid
             auto idx = try_get_position_by_name(field_names[i]);
             if (idx == std::nullopt) {
                 return Status::InvalidArgument("Cannot find struct field name {} in schema.",
                                                field_names[i]);
             }
             field_pos.push_back(idx.value());
         }
     } else {
         for (size_t i = 0; i < field_rbs.size(); i++) {
             field_pos.push_back(i);
         }
     }

     for (size_t idx = 0; idx < elems.size(); idx++) {
         auto field_rb = field_rbs[field_pos[idx]];
         // handle empty element
         if (field_rb.count() == 0) {
             struct_column->get_column(idx).insert_default();
             continue;
         }
         // handle null element
         if (field_rb.count() == 4 && strncmp(field_rb.position(), "null", 4) == 0) {
             auto& nested_null_col =
                     reinterpret_cast<ColumnNullable&>(struct_column->get_column(idx));
             nested_null_col.insert_null_elements(1);
             continue;
         }
         auto st = elems[idx]->from_string(field_rb, &struct_column->get_column(idx));
         if (!st.ok()) {
             // we should do column revert if error
             for (size_t j = 0; j < idx; j++) {
                 struct_column->get_column(j).pop_back(1);
             }
             return st;
         }
     }

     return Status::OK();
 }

 std::string DataTypeStruct::to_string(const IColumn& column, size_t row_num) const {
     auto result = check_column_const_set_readability(column, row_num);
     ColumnPtr ptr = result.first;
     row_num = result.second;

     auto& struct_column = assert_cast<const ColumnStruct&>(*ptr);

     std::string str;
     str += "{";
     for (size_t idx = 0; idx < elems.size(); idx++) {
         if (idx != 0) {
             str += ", ";
         }
         str += elems[idx]->to_string(struct_column.get_column(idx), row_num);
     }
     str += "}";
     return str;
 }

 void DataTypeStruct::to_string(const IColumn& column, size_t row_num, BufferWritable& ostr) const {
     auto result = check_column_const_set_readability(column, row_num);
     ColumnPtr ptr = result.first;
     row_num = result.second;

     auto& struct_column = assert_cast<const ColumnStruct&>(*ptr);
     ostr.write("{", 1);
     for (size_t idx = 0; idx < elems.size(); idx++) {
         if (idx != 0) {
             ostr.write(", ", 2);
         }
         elems[idx]->to_string(struct_column.get_column(idx), row_num, ostr);
     }
     ostr.write("}", 1);
 }

 static inline IColumn& extract_element_column(IColumn& column, size_t idx) {
     return assert_cast<ColumnStruct&>(column).get_column(idx);
 }

 template <typename F>
 void add_element_safe(const DataTypes& elems, IColumn& column, F&& impl) {
     /// We use the assumption that tuples of zero size do not exist.
     size_t old_size = column.size();

     try {
         impl();

         // Check that all columns now have the same size.
         size_t new_size = column.size();

         for (auto i = 0; i < elems.size(); i++) {
             const auto& element_column = extract_element_column(column, i);
             if (element_column.size() != new_size) {
                 // This is not a logical error because it may work with
                 // user-supplied data.
                 LOG(FATAL) << "Cannot read a tuple because not all elements are present";
                 __builtin_unreachable();
             }
         }
     } catch (...) {
         for (auto i = 0; i < elems.size(); i++) {
             auto& element_column = extract_element_column(column, i);

             if (element_column.size() > old_size) {
                 element_column.pop_back(1);
             }
         }

         throw;
     }
 }

 MutableColumnPtr DataTypeStruct::create_column() const {
     size_t size = elems.size();
     MutableColumns tuple_columns(size);
     for (size_t i = 0; i < size; ++i) {
         tuple_columns[i] = elems[i]->create_column();
     }
     return ColumnStruct::create(std::move(tuple_columns));
 }

 Field DataTypeStruct::get_default() const {
     size_t size = elems.size();
     Tuple t;
     for (size_t i = 0; i < size; ++i) {
         t.push_back(elems[i]->get_default());
     }
     return t;
 }

 void DataTypeStruct::insert_default_into(IColumn& column) const {
     add_element_safe(elems, column, [&] {
         for (auto i = 0; i < elems.size(); i++) {
             elems[i]->insert_default_into(extract_element_column(column, i));
         }
     });
 }

 bool DataTypeStruct::equals(const IDataType& rhs) const {
     if (typeid(rhs) != typeid(*this)) {
         return false;
     }

     const DataTypeStruct& rhs_tuple = static_cast<const DataTypeStruct&>(rhs);

     size_t size = elems.size();
     if (size != rhs_tuple.elems.size()) {
         return false;
     }

     for (size_t i = 0; i < size; ++i) {
         if (!elems[i]->equals(*rhs_tuple.elems[i])) {
             return false;
         }
     }

     return true;
 }

 size_t DataTypeStruct::get_position_by_name(const String& name) const {
     size_t size = elems.size();
     for (size_t i = 0; i < size; ++i) {
         if (names[i] == name) {
             return i;
         }
     }
     LOG(FATAL) << "Struct doesn't have element with name '" + name + "'";
     __builtin_unreachable();
 }

 std::optional<size_t> DataTypeStruct::try_get_position_by_name(const String& name) const {
     size_t size = elems.size();
     for (size_t i = 0; i < size; ++i) {
         if (names[i] == name) {
             return std::optional<size_t>(i);
         }
     }
     return std::nullopt;
 }

 String DataTypeStruct::get_name_by_position(size_t i) const {
     return names[i];
 }

 int64_t DataTypeStruct::get_uncompressed_serialized_bytes(const IColumn& column,
                                                           int be_exec_version) const {
     auto ptr = column.convert_to_full_column_if_const();
     const auto& struct_column = assert_cast<const ColumnStruct&>(*ptr.get());
     DCHECK(elems.size() == struct_column.tuple_size());

     int64_t bytes = 0;
     for (size_t i = 0; i < elems.size(); ++i) {
         bytes += elems[i]->get_uncompressed_serialized_bytes(struct_column.get_column(i),
                                                              be_exec_version);
     }
     return bytes;
 }

 char* DataTypeStruct::serialize(const IColumn& column, char* buf, int be_exec_version) const {
     auto ptr = column.convert_to_full_column_if_const();
     const auto& struct_column = assert_cast<const ColumnStruct&>(*ptr.get());
     DCHECK(elems.size() == struct_column.tuple_size());

     for (size_t i = 0; i < elems.size(); ++i) {
         buf = elems[i]->serialize(struct_column.get_column(i), buf, be_exec_version);
     }
     return buf;
 }

 const char* DataTypeStruct::deserialize(const char* buf, IColumn* column,
                                         int be_exec_version) const {
     auto* struct_column = assert_cast<ColumnStruct*>(column);
     DCHECK(elems.size() == struct_column->tuple_size());

     for (size_t i = 0; i < elems.size(); ++i) {
         buf = elems[i]->deserialize(buf, &struct_column->get_column(i), be_exec_version);
     }
     return buf;
 }

 void DataTypeStruct::to_pb_column_meta(PColumnMeta* col_meta) const {
     IDataType::to_pb_column_meta(col_meta);
     for (size_t i = 0; i < elems.size(); ++i) {
         auto child = col_meta->add_children();
         child->set_name(names[i]);
         elems[i]->to_pb_column_meta(child);
     }
 }

 bool DataTypeStruct::text_can_contain_only_valid_utf8() const {
     return std::all_of(elems.begin(), elems.end(),
                        [](auto&& elem) { return elem->text_can_contain_only_valid_utf8(); });
 }

 bool DataTypeStruct::have_maximum_size_of_value() const {
     return std::all_of(elems.begin(), elems.end(),
                        [](auto&& elem) { return elem->have_maximum_size_of_value(); });
 }

 bool DataTypeStruct::is_comparable() const {
     return std::all_of(elems.begin(), elems.end(),
                        [](auto&& elem) { return elem->is_comparable(); });
 }

 size_t DataTypeStruct::get_maximum_size_of_value_in_memory() const {
     size_t res = 0;
     for (const auto& elem : elems) {
         res += elem->get_maximum_size_of_value_in_memory();
     }
     return res;
 }

 size_t DataTypeStruct::get_size_of_value_in_memory() const {
     size_t res = 0;
     for (const auto& elem : elems) {
         res += elem->get_size_of_value_in_memory();
     }
     return res;
 }

 } // namespace doris::vectorized
	// Licensed to the Apache Software Foundation (ASF) under one
	// or more contributor license agreements. See the NOTICE file
	// distributed with this work for additional information
	// regarding copyright ownership. The ASF licenses this file
	// to you under the Apache License, Version 2.0 (the
	// "License"); you may not use this file except in compliance
	// with the License. You may obtain a copy of the License at
	//
	// http://www.apache.org/licenses/LICENSE-2.0
	//
	// Unless required by applicable law or agreed to in writing,
	// software distributed under the License is distributed on an
	// "AS IS" BASIS, WITHOUT WARRANTIES OR CONDITIONS OF ANY
	// KIND, either express or implied. See the License for the
	// specific language governing permissions and limitations
	// under the License.
	// This file is copied from
	// https://github.com/ClickHouse/ClickHouse/blob/master/src/DataTypes/DataTypeTuple.cpp
	// and modified by Doris

	#include "vec/data_types/data_type_struct.h"

	#include <ctype.h>
	#include <fmt/format.h>
	#include <gen_cpp/data.pb.h>
	#include <glog/logging.h>
	#include <string.h>

	#include <algorithm>
	#include <memory>
	#include <ostream>
	#include <typeinfo>
	#include <unordered_set>
	#include <utility>
	#include <vector>

	#include "vec/columns/column.h"
	#include "vec/columns/column_const.h"
	#include "vec/columns/column_nullable.h"
	#include "vec/columns/column_struct.h"
	#include "vec/common/assert_cast.h"
	#include "vec/common/string_buffer.hpp"
	#include "vec/common/string_ref.h"
	#include "vec/io/reader_buffer.h"

	namespace doris::vectorized {

	DataTypeStruct::DataTypeStruct(const DataTypes& elems_)
	: elems(elems_), have_explicit_names(false) {
	/// Automatically assigned names in form of '1', '2', ...
	size_t size = elems.size();
	names.resize(size);
	for (size_t i = 0; i < size; ++i) {
	names[i] = std::to_string(i + 1);
	}
	}

	static Status check_tuple_names(const Strings& names) {
	std::unordered_set<String> names_set;
	for (const auto& name : names) {
	if (name.empty()) {
	return Status::InvalidArgument("Names of tuple elements cannot be empty");
	}

	if (!names_set.insert(name).second) {
	return Status::InvalidArgument("Names of tuple elements must be unique");
	}
	}

	return {};
	}

	DataTypeStruct::DataTypeStruct(const DataTypes& elems_, const Strings& names_)
	: elems(elems_), names(names_), have_explicit_names(true) {
	size_t size = elems.size();
	if (names.size() != size) {
	LOG(FATAL) << "Wrong number of names passed to constructor of DataTypeStruct";
	__builtin_unreachable();
	}

	Status st = check_tuple_names(names);
	}

	std::string DataTypeStruct::do_get_name() const {
	size_t size = elems.size();
	std::stringstream s;

	s << "Struct(";
	for (size_t i = 0; i < size; ++i) {
	if (i != 0) {
	s << ", ";
	}
	s << names[i] << ":";
	s << elems[i]->get_name();
	}
	s << ")";

	return s.str();
	}

	Status DataTypeStruct::from_string(ReadBuffer& rb, IColumn* column) const {
	DCHECK(!rb.eof());
	auto* struct_column = assert_cast<ColumnStruct*>(column);

	if (*rb.position() != '{') {
	return Status::InvalidArgument("Struct does not start with '{}' character, found '{}'", "{",
	*rb.position());
	}
	if (*(rb.end() - 1) != '}') {
	return Status::InvalidArgument("Struct does not end with '{}' character, found '{}'", "}",
	*(rb.end() - 1));
	}

	// here need handle the empty struct '{}'
	if (rb.count() == 2) {
	for (size_t i = 0; i < struct_column->tuple_size(); ++i) {
	struct_column->get_column(i).insert_default();
	}
	return Status::OK();
	}

	++rb.position();

	bool is_explicit_names = false;
	std::vector<std::string> field_names;
	std::vector<ReadBuffer> field_rbs;
	std::vector<size_t> field_pos;

	while (!rb.eof()) {
	StringRef slot(rb.position(), rb.count());
	bool has_quota = false;
	bool is_name = false;
	if (!DataTypeStructSerDe::next_slot_from_string(rb, slot, is_name, has_quota)) {
	return Status::InvalidArgument("Cannot read struct field from text '{}'",
	slot.to_string());
	}
	if (is_name) {
	std::string name = slot.to_string();
	if (!DataTypeStructSerDe::next_slot_from_string(rb, slot, is_name, has_quota)) {
	return Status::InvalidArgument("Cannot read struct field from text '{}'",
	slot.to_string());
	}
	ReadBuffer field_rb(const_cast<char*>(slot.data), slot.size);
	field_names.push_back(name);
	field_rbs.push_back(field_rb);

	if (!is_explicit_names) {
	is_explicit_names = true;
	}
	} else {
	ReadBuffer field_rb(const_cast<char*>(slot.data), slot.size);
	field_rbs.push_back(field_rb);
	}
	}

	// TODO: should we support insert default field value when actual field number is less than
	// schema field number?
	if (field_rbs.size() != elems.size()) {
	std::string cmp_str = field_rbs.size() > elems.size() ? "more" : "less";
	return Status::InvalidArgument(
	"Actual struct field number {} is {} than schema field number {}.",
	field_rbs.size(), cmp_str, elems.size());
	}

	if (is_explicit_names) {
	if (field_names.size() != field_rbs.size()) {
	return Status::InvalidArgument(
	"Struct field name number {} is not equal to field number {}.",
	field_names.size(), field_rbs.size());
	}
	std::unordered_set<std::string> name_set;
	for (size_t i = 0; i < field_names.size(); i++) {
	// check duplicate fields
	auto ret = name_set.insert(field_names[i]);
	if (!ret.second) {
	return Status::InvalidArgument("Struct field name {} is duplicate with others.",
	field_names[i]);
	}
	// check name valid
	auto idx = try_get_position_by_name(field_names[i]);
	if (idx == std::nullopt) {
	return Status::InvalidArgument("Cannot find struct field name {} in schema.",
	field_names[i]);
	}
	field_pos.push_back(idx.value());
	}
	} else {
	for (size_t i = 0; i < field_rbs.size(); i++) {
	field_pos.push_back(i);
	}
	}

	for (size_t idx = 0; idx < elems.size(); idx++) {
	auto field_rb = field_rbs[field_pos[idx]];
	// handle empty element
	if (field_rb.count() == 0) {
	struct_column->get_column(idx).insert_default();
	continue;
	}
	// handle null element
	if (field_rb.count() == 4 && strncmp(field_rb.position(), "null", 4) == 0) {
	auto& nested_null_col =
	reinterpret_cast<ColumnNullable&>(struct_column->get_column(idx));
	nested_null_col.insert_null_elements(1);
	continue;
	}
	auto st = elems[idx]->from_string(field_rb, &struct_column->get_column(idx));
	if (!st.ok()) {
	// we should do column revert if error
	for (size_t j = 0; j < idx; j++) {
	struct_column->get_column(j).pop_back(1);
	}
	return st;
	}
	}

	return Status::OK();
	}

	std::string DataTypeStruct::to_string(const IColumn& column, size_t row_num) const {
	auto result = check_column_const_set_readability(column, row_num);
	ColumnPtr ptr = result.first;
	row_num = result.second;

	auto& struct_column = assert_cast<const ColumnStruct&>(*ptr);

	std::string str;
	str += "{";
	for (size_t idx = 0; idx < elems.size(); idx++) {
	if (idx != 0) {
	str += ", ";
	}
	str += elems[idx]->to_string(struct_column.get_column(idx), row_num);
	}
	str += "}";
	return str;
	}

	void DataTypeStruct::to_string(const IColumn& column, size_t row_num, BufferWritable& ostr) const {
	auto result = check_column_const_set_readability(column, row_num);
	ColumnPtr ptr = result.first;
	row_num = result.second;

	auto& struct_column = assert_cast<const ColumnStruct&>(*ptr);
	ostr.write("{", 1);
	for (size_t idx = 0; idx < elems.size(); idx++) {
	if (idx != 0) {
	ostr.write(", ", 2);
	}
	elems[idx]->to_string(struct_column.get_column(idx), row_num, ostr);
	}
	ostr.write("}", 1);
	}

	static inline IColumn& extract_element_column(IColumn& column, size_t idx) {
	return assert_cast<ColumnStruct&>(column).get_column(idx);
	}

	template <typename F>
	void add_element_safe(const DataTypes& elems, IColumn& column, F&& impl) {
	/// We use the assumption that tuples of zero size do not exist.
	size_t old_size = column.size();

	try {
	impl();

	// Check that all columns now have the same size.
	size_t new_size = column.size();

	for (auto i = 0; i < elems.size(); i++) {
	const auto& element_column = extract_element_column(column, i);
	if (element_column.size() != new_size) {
	// This is not a logical error because it may work with
	// user-supplied data.
	LOG(FATAL) << "Cannot read a tuple because not all elements are present";
	__builtin_unreachable();
	}
	}
	} catch (...) {
	for (auto i = 0; i < elems.size(); i++) {
	auto& element_column = extract_element_column(column, i);

	if (element_column.size() > old_size) {
	element_column.pop_back(1);
	}
	}

	throw;
	}
	}

	MutableColumnPtr DataTypeStruct::create_column() const {
	size_t size = elems.size();
	MutableColumns tuple_columns(size);
	for (size_t i = 0; i < size; ++i) {
	tuple_columns[i] = elems[i]->create_column();
	}
	return ColumnStruct::create(std::move(tuple_columns));
	}

	Field DataTypeStruct::get_default() const {
	size_t size = elems.size();
	Tuple t;
	for (size_t i = 0; i < size; ++i) {
	t.push_back(elems[i]->get_default());
	}
	return t;
	}

	void DataTypeStruct::insert_default_into(IColumn& column) const {
	add_element_safe(elems, column, [&] {
	for (auto i = 0; i < elems.size(); i++) {
	elems[i]->insert_default_into(extract_element_column(column, i));
	}
	});
	}

	bool DataTypeStruct::equals(const IDataType& rhs) const {
	if (typeid(rhs) != typeid(*this)) {
	return false;
	}

	const DataTypeStruct& rhs_tuple = static_cast<const DataTypeStruct&>(rhs);

	size_t size = elems.size();
	if (size != rhs_tuple.elems.size()) {
	return false;
	}

	for (size_t i = 0; i < size; ++i) {
	if (!elems[i]->equals(*rhs_tuple.elems[i])) {
	return false;
	}
	}

	return true;
	}

	size_t DataTypeStruct::get_position_by_name(const String& name) const {
	size_t size = elems.size();
	for (size_t i = 0; i < size; ++i) {
	if (names[i] == name) {
	return i;
	}
	}
	LOG(FATAL) << "Struct doesn't have element with name '" + name + "'";
	__builtin_unreachable();
	}

	std::optional<size_t> DataTypeStruct::try_get_position_by_name(const String& name) const {
	size_t size = elems.size();
	for (size_t i = 0; i < size; ++i) {
	if (names[i] == name) {
	return std::optional<size_t>(i);
	}
	}
	return std::nullopt;
	}

	String DataTypeStruct::get_name_by_position(size_t i) const {
	return names[i];
	}

	int64_t DataTypeStruct::get_uncompressed_serialized_bytes(const IColumn& column,
	int be_exec_version) const {
	auto ptr = column.convert_to_full_column_if_const();
	const auto& struct_column = assert_cast<const ColumnStruct&>(*ptr.get());
	DCHECK(elems.size() == struct_column.tuple_size());

	int64_t bytes = 0;
	for (size_t i = 0; i < elems.size(); ++i) {
	bytes += elems[i]->get_uncompressed_serialized_bytes(struct_column.get_column(i),
	be_exec_version);
	}
	return bytes;
	}

	char* DataTypeStruct::serialize(const IColumn& column, char* buf, int be_exec_version) const {
	auto ptr = column.convert_to_full_column_if_const();
	const auto& struct_column = assert_cast<const ColumnStruct&>(*ptr.get());
	DCHECK(elems.size() == struct_column.tuple_size());

	for (size_t i = 0; i < elems.size(); ++i) {
	buf = elems[i]->serialize(struct_column.get_column(i), buf, be_exec_version);
	}
	return buf;
	}

	const char* DataTypeStruct::deserialize(const char* buf, IColumn* column,
	int be_exec_version) const {
	auto* struct_column = assert_cast<ColumnStruct*>(column);
	DCHECK(elems.size() == struct_column->tuple_size());

	for (size_t i = 0; i < elems.size(); ++i) {
	buf = elems[i]->deserialize(buf, &struct_column->get_column(i), be_exec_version);
	}
	return buf;
	}

	void DataTypeStruct::to_pb_column_meta(PColumnMeta* col_meta) const {
	IDataType::to_pb_column_meta(col_meta);
	for (size_t i = 0; i < elems.size(); ++i) {
	auto child = col_meta->add_children();
	child->set_name(names[i]);
	elems[i]->to_pb_column_meta(child);
	}
	}

	bool DataTypeStruct::text_can_contain_only_valid_utf8() const {
	return std::all_of(elems.begin(), elems.end(),
	[](auto&& elem) { return elem->text_can_contain_only_valid_utf8(); });
	}

	bool DataTypeStruct::have_maximum_size_of_value() const {
	return std::all_of(elems.begin(), elems.end(),
	[](auto&& elem) { return elem->have_maximum_size_of_value(); });
	}

	bool DataTypeStruct::is_comparable() const {
	return std::all_of(elems.begin(), elems.end(),
	[](auto&& elem) { return elem->is_comparable(); });
	}

	size_t DataTypeStruct::get_maximum_size_of_value_in_memory() const {
	size_t res = 0;
	for (const auto& elem : elems) {
	res += elem->get_maximum_size_of_value_in_memory();
	}
	return res;
	}

	size_t DataTypeStruct::get_size_of_value_in_memory() const {
	size_t res = 0;
	for (const auto& elem : elems) {
	res += elem->get_size_of_value_in_memory();
	}
	return res;
	}

	} // namespace doris::vectorized