go/parquet/file/record_reader.go - arrow - Git at Google

 // Licensed to the Apache Software Foundation (ASF) under one
 // or more contributor license agreements.  See the NOTICE file
 // distributed with this work for additional information
 // regarding copyright ownership.  The ASF licenses this file
 // to you under the Apache License, Version 2.0 (the
 // "License"); you may not use this file except in compliance
 // with the License.  You may obtain a copy of the License at
 //
 // http://www.apache.org/licenses/LICENSE-2.0
 //
 // Unless required by applicable law or agreed to in writing, software
 // distributed under the License is distributed on an "AS IS" BASIS,
 // WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
 // See the License for the specific language governing permissions and
 // limitations under the License.

 package file

 import (
 	"fmt"
 	"sync/atomic"
 	"unsafe"

 	"github.com/JohnCGriffin/overflow"
 	"github.com/apache/arrow/go/v9/arrow"
 	"github.com/apache/arrow/go/v9/arrow/array"
 	"github.com/apache/arrow/go/v9/arrow/bitutil"
 	"github.com/apache/arrow/go/v9/arrow/memory"
 	"github.com/apache/arrow/go/v9/internal/utils"
 	"github.com/apache/arrow/go/v9/parquet"
 	"github.com/apache/arrow/go/v9/parquet/internal/encoding"
 	"github.com/apache/arrow/go/v9/parquet/schema"
 	"golang.org/x/xerrors"
 )

 // RecordReader is an interface for reading entire records/rows at a time
 // from a parquet file for both flat and nested columns. Properly delimiting
 // semantic records according to the def and repetition levels.
 type RecordReader interface {
 	// DefLevels returns the current crop of definition levels for this record
 	DefLevels() []int16
 	// LevelsPos is the number of definition / repetition levels (from the decoded ones)
 	// which the reader has already consumed.
 	LevelsPos() int64
 	// RepLevels returns the current decoded repetition levels
 	RepLevels() []int16
 	// Reset resets the state, clearing consumed values and repetition/definition
 	// levels as the result of calling ReadRecords
 	Reset()
 	// Reserve pre-allocates space for data
 	Reserve(int64) error
 	// HasMore returns true if there is more internal data which hasn't been
 	// processed yet.
 	HasMore() bool
 	// ReadRecords attempts to read the provided number of records from the
 	// column chunk, returning the number of records read and any error.
 	ReadRecords(num int64) (int64, error)
 	// ValuesWritten is the number of values written internally including any nulls
 	ValuesWritten() int
 	// ReleaseValidBits transfers the buffer of bits for the validity bitmap
 	// to the caller, subsequent calls will allocate a new one in the reader.
 	ReleaseValidBits() *memory.Buffer
 	// ReleaseValues transfers the buffer of data with the values to the caller,
 	// a new buffer will be allocated on subsequent calls.
 	ReleaseValues() *memory.Buffer
 	// NullCount returns the number of nulls decoded
 	NullCount() int64
 	// Type returns the parquet physical type of the column
 	Type() parquet.Type
 	// Values returns the decoded data buffer, including any nulls, without
 	// transferring ownership
 	Values() []byte
 	// SetPageReader allows progressing to the next column chunk while reusing
 	// this record reader by providing the page reader for the next chunk.
 	SetPageReader(PageReader)
 	// Retain increments the ref count by one
 	Retain()
 	// Release decrements the ref count by one, releasing the internal buffers when
 	// the ref count is 0.
 	Release()
 }

 // BinaryRecordReader provides an extra GetBuilderChunks function above and beyond
 // the plain RecordReader to allow for efficiently building chunked arrays.
 type BinaryRecordReader interface {
 	RecordReader
 	GetBuilderChunks() []arrow.Array
 }

 // recordReaderImpl is the internal interface implemented for different types
 // enabling reuse of the higher level record reader logic.
 type recordReaderImpl interface {
 	ColumnChunkReader
 	ReadValuesDense(int64) error
 	ReadValuesSpaced(int64, int64) error
 	ReserveValues(int64, bool) error
 	ResetValues()
 	GetValidBits() []byte
 	IncrementWritten(int64, int64)
 	ValuesWritten() int64
 	ReleaseValidBits() *memory.Buffer
 	ReleaseValues() *memory.Buffer
 	NullCount() int64
 	Values() []byte
 	SetPageReader(PageReader)
 	Retain()
 	Release()
 }

 type binaryRecordReaderImpl interface {
 	recordReaderImpl
 	GetBuilderChunks() []arrow.Array
 }

 // primitiveRecordReader is a record reader for primitive types, ie: not byte array or fixed len byte array
 type primitiveRecordReader struct {
 	ColumnChunkReader

 	valuesWritten int64
 	valuesCap     int64
 	nullCount     int64
 	values        *memory.Buffer
 	validBits     *memory.Buffer
 	mem           memory.Allocator

 	refCount  int64
 	useValues bool
 }

 func createPrimitiveRecordReader(descr *schema.Column, mem memory.Allocator) primitiveRecordReader {
 	return primitiveRecordReader{
 		ColumnChunkReader: NewColumnReader(descr, nil, mem),
 		values:            memory.NewResizableBuffer(mem),
 		validBits:         memory.NewResizableBuffer(mem),
 		mem:               mem,
 		refCount:          1,
 		useValues:         descr.PhysicalType() != parquet.Types.ByteArray && descr.PhysicalType() != parquet.Types.FixedLenByteArray,
 	}
 }

 func (pr *primitiveRecordReader) Retain() {
 	atomic.AddInt64(&pr.refCount, 1)
 }

 func (pr *primitiveRecordReader) Release() {
 	if atomic.AddInt64(&pr.refCount, -1) == 0 {
 		if pr.values != nil {
 			pr.values.Release()
 			pr.values = nil
 		}
 		if pr.validBits != nil {
 			pr.validBits.Release()
 			pr.validBits = nil
 		}
 	}
 }

 func (pr *primitiveRecordReader) SetPageReader(rdr PageReader) {
 	pr.ColumnChunkReader.setPageReader(rdr)
 }

 func (pr *primitiveRecordReader) ReleaseValidBits() *memory.Buffer {
 	res := pr.validBits
 	res.Resize(int(bitutil.BytesForBits(pr.valuesWritten)))
 	pr.validBits = memory.NewResizableBuffer(pr.mem)
 	return res
 }

 func (pr *primitiveRecordReader) ReleaseValues() (res *memory.Buffer) {
 	res = pr.values
 	nbytes, err := pr.numBytesForValues(pr.valuesWritten)
 	if err != nil {
 		panic(err)
 	}
 	res.Resize(int(nbytes))
 	pr.values = memory.NewResizableBuffer(pr.mem)
 	pr.valuesCap = 0

 	return
 }

 func (pr *primitiveRecordReader) NullCount() int64 { return pr.nullCount }

 func (pr *primitiveRecordReader) IncrementWritten(w, n int64) {
 	pr.valuesWritten += w
 	pr.nullCount += n
 }
 func (pr *primitiveRecordReader) GetValidBits() []byte { return pr.validBits.Bytes() }
 func (pr *primitiveRecordReader) ValuesWritten() int64 { return pr.valuesWritten }
 func (pr *primitiveRecordReader) Values() []byte       { return pr.values.Bytes() }
 func (pr *primitiveRecordReader) ResetValues() {
 	if pr.valuesWritten > 0 {
 		pr.values.ResizeNoShrink(0)
 		pr.validBits.ResizeNoShrink(0)
 		pr.valuesWritten = 0
 		pr.valuesCap = 0
 		pr.nullCount = 0
 	}
 }

 func (pr *primitiveRecordReader) numBytesForValues(nitems int64) (num int64, err error) {
 	typeSize := int64(pr.Descriptor().PhysicalType().ByteSize())
 	var ok bool
 	if num, ok = overflow.Mul64(nitems, typeSize); !ok {
 		err = xerrors.New("total size of items too large")
 	}
 	return
 }

 func (pr *primitiveRecordReader) ReserveValues(extra int64, hasNullable bool) error {
 	newCap, err := updateCapacity(pr.valuesCap, pr.valuesWritten, extra)
 	if err != nil {
 		return err
 	}
 	if newCap > pr.valuesCap {
 		capBytes, err := pr.numBytesForValues(newCap)
 		if err != nil {
 			return err
 		}
 		if pr.useValues {
 			pr.values.ResizeNoShrink(int(capBytes))
 		}
 		pr.valuesCap = newCap
 	}
 	if hasNullable {
 		validBytesCap := bitutil.BytesForBits(pr.valuesCap)
 		if pr.validBits.Len() < int(validBytesCap) {
 			pr.validBits.ResizeNoShrink(int(validBytesCap))
 		}
 	}
 	return nil
 }

 func (pr *primitiveRecordReader) ReadValuesDense(toRead int64) (err error) {
 	switch cr := pr.ColumnChunkReader.(type) {
 	case *BooleanColumnChunkReader:
 		data := pr.values.Bytes()[int(pr.valuesWritten):]
 		values := *(*[]bool)(unsafe.Pointer(&data))
 		_, err = cr.curDecoder.(encoding.BooleanDecoder).Decode(values[:toRead])
 	case *Int32ColumnChunkReader:
 		values := arrow.Int32Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Int32Decoder).Decode(values[:toRead])
 	case *Int64ColumnChunkReader:
 		values := arrow.Int64Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Int64Decoder).Decode(values[:toRead])
 	case *Int96ColumnChunkReader:
 		values := parquet.Int96Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Int96Decoder).Decode(values[:toRead])
 	case *ByteArrayColumnChunkReader:
 		values := parquet.ByteArrayTraits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.ByteArrayDecoder).Decode(values[:toRead])
 	case *FixedLenByteArrayColumnChunkReader:
 		values := parquet.FixedLenByteArrayTraits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.FixedLenByteArrayDecoder).Decode(values[:toRead])
 	case *Float32ColumnChunkReader:
 		values := arrow.Float32Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Float32Decoder).Decode(values[:toRead])
 	case *Float64ColumnChunkReader:
 		values := arrow.Float64Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Float64Decoder).Decode(values[:toRead])
 	default:
 		panic("invalid type for record reader")
 	}
 	return
 }

 func (pr *primitiveRecordReader) ReadValuesSpaced(valuesWithNulls, nullCount int64) (err error) {
 	validBits := pr.validBits.Bytes()
 	offset := pr.valuesWritten

 	switch cr := pr.ColumnChunkReader.(type) {
 	case *BooleanColumnChunkReader:
 		data := pr.values.Bytes()[int(pr.valuesWritten):]
 		values := *(*[]bool)(unsafe.Pointer(&data))
 		_, err = cr.curDecoder.(encoding.BooleanDecoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	case *Int32ColumnChunkReader:
 		values := arrow.Int32Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Int32Decoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	case *Int64ColumnChunkReader:
 		values := arrow.Int64Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Int64Decoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	case *Int96ColumnChunkReader:
 		values := parquet.Int96Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Int96Decoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	case *ByteArrayColumnChunkReader:
 		values := parquet.ByteArrayTraits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.ByteArrayDecoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	case *FixedLenByteArrayColumnChunkReader:
 		values := parquet.FixedLenByteArrayTraits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.FixedLenByteArrayDecoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	case *Float32ColumnChunkReader:
 		values := arrow.Float32Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Float32Decoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	case *Float64ColumnChunkReader:
 		values := arrow.Float64Traits.CastFromBytes(pr.values.Bytes())[int(pr.valuesWritten):]
 		_, err = cr.curDecoder.(encoding.Float64Decoder).DecodeSpaced(values[:int(valuesWithNulls)], int(nullCount), validBits, offset)
 	default:
 		panic("invalid type for record reader")
 	}
 	return
 }

 type recordReader struct {
 	recordReaderImpl
 	leafInfo LevelInfo

 	atRecStart  bool
 	recordsRead int64

 	levelsWritten int64
 	levelsPos     int64
 	levelsCap     int64

 	defLevels *memory.Buffer
 	repLevels *memory.Buffer

 	refCount int64
 }

 // binaryRecordReader is the recordReaderImpl for non-primitive data
 type binaryRecordReader struct {
 	*recordReader
 }

 func (b *binaryRecordReader) GetBuilderChunks() []arrow.Array {
 	return b.recordReaderImpl.(binaryRecordReaderImpl).GetBuilderChunks()
 }

 func newRecordReader(descr *schema.Column, info LevelInfo, mem memory.Allocator) RecordReader {
 	if mem == nil {
 		mem = memory.DefaultAllocator
 	}

 	pr := createPrimitiveRecordReader(descr, mem)
 	return &recordReader{
 		refCount:         1,
 		recordReaderImpl: &pr,
 		leafInfo:         info,
 		defLevels:        memory.NewResizableBuffer(mem),
 		repLevels:        memory.NewResizableBuffer(mem),
 	}
 }

 func (rr *recordReader) Retain() {
 	atomic.AddInt64(&rr.refCount, 1)
 }

 func (rr *recordReader) Release() {
 	if atomic.AddInt64(&rr.refCount, -1) == 0 {
 		rr.recordReaderImpl.Release()
 		rr.defLevels.Release()
 		rr.repLevels.Release()
 		rr.defLevels, rr.repLevels = nil, nil
 	}
 }

 func (rr *recordReader) DefLevels() []int16 {
 	return arrow.Int16Traits.CastFromBytes(rr.defLevels.Bytes())
 }

 func (rr *recordReader) RepLevels() []int16 {
 	return arrow.Int16Traits.CastFromBytes(rr.repLevels.Bytes())
 }

 func (rr *recordReader) HasMore() bool {
 	return rr.pager() != nil
 }

 func (rr *recordReader) SetPageReader(pr PageReader) {
 	rr.atRecStart = true
 	rr.recordReaderImpl.SetPageReader(pr)
 }

 func (rr *recordReader) ValuesWritten() int {
 	return int(rr.recordReaderImpl.ValuesWritten())
 }

 func (rr *recordReader) LevelsPos() int64 { return rr.levelsPos }

 func updateCapacity(cap, size, extra int64) (int64, error) {
 	if extra < 0 {
 		return 0, xerrors.New("negative size (corrupt file?)")
 	}
 	target, ok := overflow.Add64(size, extra)
 	if !ok {
 		return 0, xerrors.New("allocation size too large (corrupt file?)")
 	}
 	if target >= (1 << 62) {
 		return 0, xerrors.New("allocation size too large (corrupt file?)")
 	}
 	if cap >= target {
 		return cap, nil
 	}
 	return int64(bitutil.NextPowerOf2(int(target))), nil
 }

 func (rr *recordReader) Reserve(cap int64) error {
 	if err := rr.reserveLevels(cap); err != nil {
 		return err
 	}
 	if err := rr.reserveValues(cap); err != nil {
 		return err
 	}
 	return nil
 }

 func (rr *recordReader) reserveLevels(extra int64) error {
 	if rr.Descriptor().MaxDefinitionLevel() > 0 {
 		newCap, err := updateCapacity(rr.levelsCap, rr.levelsWritten, extra)
 		if err != nil {
 			return err
 		}

 		if newCap > rr.levelsCap {
 			capBytes, ok := overflow.Mul(int(newCap), arrow.Int16SizeBytes)
 			if !ok {
 				return fmt.Errorf("allocation size too large (corrupt file?)")
 			}
 			rr.defLevels.ResizeNoShrink(capBytes)
 			if rr.Descriptor().MaxRepetitionLevel() > 0 {
 				rr.repLevels.ResizeNoShrink(capBytes)
 			}
 			rr.levelsCap = newCap
 		}
 	}
 	return nil
 }

 func (rr *recordReader) reserveValues(extra int64) error {
 	return rr.recordReaderImpl.ReserveValues(extra, rr.leafInfo.HasNullableValues())
 }

 func (rr *recordReader) resetValues() {
 	rr.recordReaderImpl.ResetValues()
 }

 func (rr *recordReader) Reset() {
 	rr.resetValues()

 	if rr.levelsWritten > 0 {
 		remain := int(rr.levelsWritten - rr.levelsPos)
 		// shift remaining levels to beginning of buffer and trim only the
 		// number decoded remaining
 		defData := rr.DefLevels()

 		copy(defData, defData[int(rr.levelsPos):int(rr.levelsWritten)])
 		rr.defLevels.ResizeNoShrink(remain * int(arrow.Int16SizeBytes))

 		if rr.Descriptor().MaxRepetitionLevel() > 0 {
 			repData := rr.RepLevels()
 			copy(repData, repData[int(rr.levelsPos):int(rr.levelsWritten)])
 			rr.repLevels.ResizeNoShrink(remain * int(arrow.Int16SizeBytes))
 		}

 		rr.levelsWritten -= rr.levelsPos
 		rr.levelsPos = 0
 		rr.levelsCap = int64(remain)
 	}

 	rr.recordsRead = 0
 }

 // process written rep/def levels to read the end of records
 // process no more levels than necessary to delimit the indicated
 // number of logical records. updates internal state of recordreader
 // returns number of records delimited
 func (rr *recordReader) delimitRecords(numRecords int64) (recordsRead, valsToRead int64) {
 	var (
 		curRep int16
 		curDef int16
 	)

 	defLevels := rr.DefLevels()[int(rr.levelsPos):]
 	repLevels := rr.RepLevels()[int(rr.levelsPos):]

 	for rr.levelsPos < rr.levelsWritten {
 		curRep, repLevels = repLevels[0], repLevels[1:]
 		if curRep == 0 {
 			// if at record start, we are seeing the start of a record
 			// for the second time, such as after repeated calls to delimitrecords.
 			// in this case we must continue until we find another record start
 			// or exaust the column chunk
 			if !rr.atRecStart {
 				// end of a record, increment count
 				recordsRead++
 				if recordsRead == numRecords {
 					// found the number of records we wanted, set record start to true and break
 					rr.atRecStart = true
 					break
 				}
 			}
 		}
 		// we have decided to consume the level at this position
 		// advance until we find another boundary
 		rr.atRecStart = false

 		curDef, defLevels = defLevels[0], defLevels[1:]
 		if curDef == rr.Descriptor().MaxDefinitionLevel() {
 			valsToRead++
 		}
 		rr.levelsPos++
 	}
 	return
 }

 func (rr *recordReader) ReadRecordData(numRecords int64) (int64, error) {
 	possibleNum := utils.Max(numRecords, rr.levelsWritten-rr.levelsPos)
 	if err := rr.reserveValues(possibleNum); err != nil {
 		return 0, err
 	}

 	var (
 		startPos     = rr.levelsPos
 		valuesToRead int64
 		recordsRead  int64
 		nullCount    int64
 		err          error
 	)

 	if rr.Descriptor().MaxRepetitionLevel() > 0 {
 		recordsRead, valuesToRead = rr.delimitRecords(numRecords)
 	} else if rr.Descriptor().MaxDefinitionLevel() > 0 {
 		// no repetition levels, skip delimiting logic. each level
 		// represents null or not null entry
 		recordsRead = utils.Min(rr.levelsWritten-rr.levelsPos, numRecords)
 		// this is advanced by delimitRecords which we skipped
 		rr.levelsPos += recordsRead
 	} else {
 		recordsRead, valuesToRead = numRecords, numRecords
 	}

 	if rr.leafInfo.HasNullableValues() {
 		validityIO := ValidityBitmapInputOutput{
 			ReadUpperBound:  rr.levelsPos - startPos,
 			ValidBits:       rr.GetValidBits(),
 			ValidBitsOffset: rr.recordReaderImpl.ValuesWritten(),
 		}
 		DefLevelsToBitmap(rr.DefLevels()[startPos:int(rr.levelsPos)], rr.leafInfo, &validityIO)
 		valuesToRead = validityIO.Read - validityIO.NullCount
 		nullCount = validityIO.NullCount
 		err = rr.ReadValuesSpaced(validityIO.Read, nullCount)
 	} else {
 		err = rr.ReadValuesDense(valuesToRead)
 	}
 	if err != nil {
 		return 0, err
 	}

 	if rr.leafInfo.DefLevel > 0 {
 		rr.consumeBufferedValues(rr.levelsPos - startPos)
 	} else {
 		rr.consumeBufferedValues(valuesToRead)
 	}

 	// total values, including nullspaces if any
 	rr.IncrementWritten(valuesToRead+nullCount, nullCount)
 	return recordsRead, nil
 }

 const minLevelBatchSize = 1024

 func (rr *recordReader) ReadRecords(numRecords int64) (int64, error) {
 	// delimit records, then read values at the end
 	recordsRead := int64(0)

 	if rr.levelsPos < rr.levelsWritten {
 		additional, err := rr.ReadRecordData(numRecords)
 		if err != nil {
 			return 0, err
 		}
 		recordsRead += additional
 	}

 	levelBatch := utils.Max(minLevelBatchSize, numRecords)

 	// if we are in the middle of a record, continue until reaching
 	// the desired number of records or the end of the current record
 	// if we have enough
 	for !rr.atRecStart || recordsRead < numRecords {
 		// is there more data in this row group?
 		if !rr.HasNext() {
 			if !rr.atRecStart {
 				// ended the row group while inside a record we haven't seen
 				// the end of yet. increment the record count for the last record
 				// in the row group
 				recordsRead++
 				rr.atRecStart = true
 			}
 			break
 		}

 		// we perform multiple batch reads until we either exhaust the row group
 		// or observe the desired number of records
 		batchSize := utils.Min(levelBatch, rr.numAvailValues())
 		if batchSize == 0 {
 			// no more data in column
 			break
 		}

 		if rr.Descriptor().MaxDefinitionLevel() > 0 {
 			if err := rr.reserveLevels(batchSize); err != nil {
 				return 0, err
 			}

 			defLevels := rr.DefLevels()[int(rr.levelsWritten):]

 			levelsRead := 0
 			// not present for non-repeated fields
 			if rr.Descriptor().MaxRepetitionLevel() > 0 {
 				repLevels := rr.RepLevels()[int(rr.levelsWritten):]
 				levelsRead, _ = rr.readDefinitionLevels(defLevels[:batchSize])
 				if rr.readRepetitionLevels(repLevels[:batchSize]) != levelsRead {
 					return 0, xerrors.New("number of decoded rep/def levels did not match")
 				}
 			} else if rr.Descriptor().MaxDefinitionLevel() > 0 {
 				levelsRead, _ = rr.readDefinitionLevels(defLevels[:batchSize])
 			}

 			if levelsRead == 0 {
 				// exhausted column chunk
 				break
 			}

 			rr.levelsWritten += int64(levelsRead)
 			read, err := rr.ReadRecordData(numRecords - recordsRead)
 			if err != nil {
 				return recordsRead, err
 			}
 			recordsRead += read
 		} else {
 			// no rep or def levels
 			batchSize = utils.Min(numRecords-recordsRead, batchSize)
 			read, err := rr.ReadRecordData(batchSize)
 			if err != nil {
 				return recordsRead, err
 			}
 			recordsRead += read
 		}
 	}

 	return recordsRead, nil
 }

 func (rr *recordReader) ReleaseValidBits() *memory.Buffer {
 	if rr.leafInfo.HasNullableValues() {
 		return rr.recordReaderImpl.ReleaseValidBits()
 	}
 	return nil
 }

 // flbaRecordReader is the specialization for optimizing reading fixed-length
 // byte array records.
 type flbaRecordReader struct {
 	primitiveRecordReader

 	bldr     *array.FixedSizeBinaryBuilder
 	valueBuf []parquet.FixedLenByteArray
 }

 func (fr *flbaRecordReader) ReserveValues(extra int64, hasNullable bool) error {
 	fr.bldr.Reserve(int(extra))
 	return fr.primitiveRecordReader.ReserveValues(extra, hasNullable)
 }

 func (fr *flbaRecordReader) Retain() {
 	fr.bldr.Retain()
 	fr.primitiveRecordReader.Retain()
 }

 func (fr *flbaRecordReader) Release() {
 	fr.bldr.Release()
 	fr.primitiveRecordReader.Release()
 }

 func (fr *flbaRecordReader) ReadValuesDense(toRead int64) error {
 	if int64(cap(fr.valueBuf)) < toRead {
 		fr.valueBuf = make([]parquet.FixedLenByteArray, 0, toRead)
 	}

 	values := fr.valueBuf[:toRead]
 	dec := fr.ColumnChunkReader.(*FixedLenByteArrayColumnChunkReader).curDecoder.(encoding.FixedLenByteArrayDecoder)

 	_, err := dec.Decode(values)
 	if err != nil {
 		return err
 	}

 	for _, val := range values {
 		fr.bldr.Append(val)
 	}
 	fr.ResetValues()
 	return nil
 }

 func (fr *flbaRecordReader) ReadValuesSpaced(valuesWithNulls, nullCount int64) error {
 	validBits := fr.validBits.Bytes()
 	offset := fr.valuesWritten

 	if int64(cap(fr.valueBuf)) < valuesWithNulls {
 		fr.valueBuf = make([]parquet.FixedLenByteArray, 0, valuesWithNulls)
 	}

 	values := fr.valueBuf[:valuesWithNulls]
 	dec := fr.ColumnChunkReader.(*FixedLenByteArrayColumnChunkReader).curDecoder.(encoding.FixedLenByteArrayDecoder)
 	_, err := dec.DecodeSpaced(values, int(nullCount), validBits, offset)
 	if err != nil {
 		return err
 	}

 	for idx, val := range values {
 		if bitutil.BitIsSet(validBits, int(offset)+idx) {
 			fr.bldr.Append(val)
 		} else {
 			fr.bldr.AppendNull()
 		}
 	}
 	fr.ResetValues()
 	return nil
 }

 func (fr *flbaRecordReader) GetBuilderChunks() []arrow.Array {
 	return []arrow.Array{fr.bldr.NewArray()}
 }

 func newFLBARecordReader(descr *schema.Column, info LevelInfo, mem memory.Allocator) RecordReader {
 	if mem == nil {
 		mem = memory.DefaultAllocator
 	}

 	byteWidth := descr.TypeLength()

 	return &binaryRecordReader{&recordReader{
 		recordReaderImpl: &flbaRecordReader{
 			createPrimitiveRecordReader(descr, mem),
 			array.NewFixedSizeBinaryBuilder(mem, &arrow.FixedSizeBinaryType{ByteWidth: byteWidth}),
 			nil,
 		},
 		leafInfo:  info,
 		defLevels: memory.NewResizableBuffer(mem),
 		repLevels: memory.NewResizableBuffer(mem),
 		refCount:  1,
 	}}
 }

 // byteArrayRecordReader is the specialization impl for byte-array columns
 type byteArrayRecordReader struct {
 	primitiveRecordReader

 	bldr     *array.BinaryBuilder
 	valueBuf []parquet.ByteArray
 }

 func newByteArrayRecordReader(descr *schema.Column, info LevelInfo, mem memory.Allocator) RecordReader {
 	if mem == nil {
 		mem = memory.DefaultAllocator
 	}

 	dt := arrow.BinaryTypes.Binary
 	if descr.LogicalType().Equals(schema.StringLogicalType{}) {
 		dt = arrow.BinaryTypes.String
 	}

 	return &binaryRecordReader{&recordReader{
 		recordReaderImpl: &byteArrayRecordReader{
 			createPrimitiveRecordReader(descr, mem),
 			array.NewBinaryBuilder(mem, dt),
 			nil,
 		},
 		leafInfo:  info,
 		defLevels: memory.NewResizableBuffer(mem),
 		repLevels: memory.NewResizableBuffer(mem),
 		refCount:  1,
 	}}
 }

 func (fr *byteArrayRecordReader) ReserveValues(extra int64, hasNullable bool) error {
 	fr.bldr.Reserve(int(extra))
 	return fr.primitiveRecordReader.ReserveValues(extra, hasNullable)
 }

 func (fr *byteArrayRecordReader) Retain() {
 	fr.bldr.Retain()
 	fr.primitiveRecordReader.Retain()
 }

 func (fr *byteArrayRecordReader) Release() {
 	fr.bldr.Release()
 	fr.primitiveRecordReader.Release()
 }

 func (br *byteArrayRecordReader) ReadValuesDense(toRead int64) error {
 	if int64(cap(br.valueBuf)) < toRead {
 		br.valueBuf = make([]parquet.ByteArray, 0, toRead)
 	}

 	values := br.valueBuf[:toRead]
 	dec := br.ColumnChunkReader.(*ByteArrayColumnChunkReader).curDecoder.(encoding.ByteArrayDecoder)

 	_, err := dec.Decode(values)
 	if err != nil {
 		return err
 	}

 	for _, val := range values {
 		br.bldr.Append(val)
 	}
 	br.ResetValues()
 	return nil
 }

 func (br *byteArrayRecordReader) ReadValuesSpaced(valuesWithNulls, nullCount int64) error {
 	validBits := br.validBits.Bytes()
 	offset := br.valuesWritten

 	if int64(cap(br.valueBuf)) < valuesWithNulls {
 		br.valueBuf = make([]parquet.ByteArray, 0, valuesWithNulls)
 	}

 	values := br.valueBuf[:valuesWithNulls]
 	dec := br.ColumnChunkReader.(*ByteArrayColumnChunkReader).curDecoder.(encoding.ByteArrayDecoder)
 	_, err := dec.DecodeSpaced(values, int(nullCount), validBits, offset)
 	if err != nil {
 		return err
 	}

 	for idx, val := range values {
 		if bitutil.BitIsSet(validBits, int(offset)+idx) {
 			br.bldr.Append(val)
 		} else {
 			br.bldr.AppendNull()
 		}
 	}
 	br.ResetValues()
 	return nil
 }

 func (br *byteArrayRecordReader) GetBuilderChunks() []arrow.Array {
 	return []arrow.Array{br.bldr.NewArray()}
 }

 // TODO(mtopol): create optimized readers for dictionary types after ARROW-7286 is done

 func NewRecordReader(descr *schema.Column, info LevelInfo, readDict bool, mem memory.Allocator) RecordReader {
 	switch descr.PhysicalType() {
 	case parquet.Types.ByteArray:
 		return newByteArrayRecordReader(descr, info, mem)
 	case parquet.Types.FixedLenByteArray:
 		return newFLBARecordReader(descr, info, mem)
 	default:
 		return newRecordReader(descr, info, mem)
 	}
 }