asterix-app/src/main/java/edu/uci/ics/asterix/file/SecondaryInvertedIndexCreator.java - asterixdb - Git at Google

 package edu.uci.ics.asterix.file;

 import edu.uci.ics.asterix.common.exceptions.AsterixException;
 import edu.uci.ics.hyracks.algebricks.common.exceptions.AlgebricksException;
 import edu.uci.ics.hyracks.algebricks.core.rewriter.base.PhysicalOptimizationConfig;
 import edu.uci.ics.hyracks.api.job.JobSpecification;

 public class SecondaryInvertedIndexCreator extends SecondaryIndexCreator {

     protected SecondaryInvertedIndexCreator(PhysicalOptimizationConfig physOptConf) {
         super(physOptConf);
     }

     @Override
     public JobSpecification buildCreationJobSpec() throws AsterixException, AlgebricksException {
         // TODO Auto-generated method stub
         return null;
     }

     @Override
     // TODO: This code has been completely rewritten in the asterix-fuzzy branch. No tests currently rely
     // on this code, so I didn't do any cleanup here.
     public JobSpecification buildLoadingJobSpec() throws AsterixException, AlgebricksException {
         /*
         JobSpecification spec = new JobSpecification();

         String primaryIndexName = createIndexStmt.getDatasetName();
         String secondaryIndexName = createIndexStmt.getIndexName();

         AqlCompiledDatasetDecl compiledDatasetDecl = metadata.findDataset(primaryIndexName);
         if (compiledDatasetDecl == null) {
             throw new AsterixException("Could not find dataset " + primaryIndexName);
         }

         if (compiledDatasetDecl.getDatasetType() == DatasetType.EXTERNAL) {
             throw new AsterixException("Cannot index an external dataset (" + primaryIndexName + ").");
         }
         ARecordType itemType = (ARecordType) metadata.findType(compiledDatasetDecl.getItemTypeName());
         ISerializerDeserializerProvider serdeProvider = metadata.getFormat().getSerdeProvider();
         ISerializerDeserializer payloadSerde = serdeProvider.getSerializerDeserializer(itemType);

         int numPrimaryKeys = DatasetUtils.getPartitioningFunctions(compiledDatasetDecl).size();

         // sanity
         if (numPrimaryKeys > 1)
             throw new AsterixException("Cannot create inverted keyword index on dataset with composite primary key.");

         // sanity
         IAType fieldsToTokenizeType = AqlCompiledIndexDecl
                 .keyFieldType(createIndexStmt.getKeyFields().get(0), itemType);
         for (String fieldName : createIndexStmt.getKeyFields()) {
             IAType nextFieldToTokenizeType = AqlCompiledIndexDecl.keyFieldType(fieldName, itemType);
             if (nextFieldToTokenizeType.getTypeTag() != fieldsToTokenizeType.getTypeTag()) {
                 throw new AsterixException(
                         "Cannot create inverted keyword index. Fields to tokenize must be of the same type.");
             }
         }

         // ---------- START GENERAL BTREE STUFF

         IIndexRegistryProvider<IIndex> treeRegistryProvider = AsterixIndexRegistryProvider.INSTANCE;
         IStorageManagerInterface storageManager = AsterixStorageManagerInterface.INSTANCE;

         // ---------- END GENERAL BTREE STUFF

         // ---------- START KEY PROVIDER OP

         // TODO: should actually be empty tuple source
         // build tuple containing low and high search keys
         ArrayTupleBuilder tb = new ArrayTupleBuilder(1); // just one dummy field
         DataOutput dos = tb.getDataOutput();

         try {
             tb.reset();
             IntegerSerializerDeserializer.INSTANCE.serialize(0, dos); // dummy
             // field
             tb.addFieldEndOffset();
         } catch (HyracksDataException e) {
             throw new AsterixException(e);
         }

         ISerializerDeserializer[] keyRecDescSers = { IntegerSerializerDeserializer.INSTANCE };
         RecordDescriptor keyRecDesc = new RecordDescriptor(keyRecDescSers);

         Pair<IFileSplitProvider, AlgebricksPartitionConstraint> keyProviderSplitsAndConstraint = metadata
                 .splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

         ConstantTupleSourceOperatorDescriptor keyProviderOp = new ConstantTupleSourceOperatorDescriptor(spec,
                 keyRecDesc, tb.getFieldEndOffsets(), tb.getByteArray(), tb.getSize());
         AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, keyProviderOp,
                 keyProviderSplitsAndConstraint.second);

         // ---------- END KEY PROVIDER OP

         // ---------- START PRIMARY INDEX SCAN

         ISerializerDeserializer[] primaryRecFields = new ISerializerDeserializer[numPrimaryKeys + 1];
         IBinaryComparatorFactory[] primaryComparatorFactories = new IBinaryComparatorFactory[numPrimaryKeys];
         ITypeTraits[] primaryTypeTraits = new ITypeTraits[numPrimaryKeys + 1];
         int i = 0;
         for (Triple<IEvaluatorFactory, ScalarFunctionCallExpression, IAType> evalFactoryAndType : DatasetUtils
                 .getPartitioningFunctions(compiledDatasetDecl)) {
             IAType keyType = evalFactoryAndType.third;
             ISerializerDeserializer keySerde = serdeProvider.getSerializerDeserializer(keyType);
             primaryRecFields[i] = keySerde;
 			primaryComparatorFactories[i] = AqlBinaryComparatorFactoryProvider.INSTANCE
 					.getBinaryComparatorFactory(keyType, true);
             primaryTypeTraits[i] = AqlTypeTraitProvider.INSTANCE.getTypeTrait(keyType);
             ++i;
         }
         primaryRecFields[numPrimaryKeys] = payloadSerde;
         primaryTypeTraits[numPrimaryKeys] = AqlTypeTraitProvider.INSTANCE.getTypeTrait(itemType);

         int[] lowKeyFields = null; // -infinity
         int[] highKeyFields = null; // +infinity
         RecordDescriptor primaryRecDesc = new RecordDescriptor(primaryRecFields);

         Pair<IFileSplitProvider, AlgebricksPartitionConstraint> primarySplitsAndConstraint = metadata
                 .splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

         BTreeSearchOperatorDescriptor primarySearchOp = new BTreeSearchOperatorDescriptor(spec, primaryRecDesc,
                 storageManager, treeRegistryProvider, primarySplitsAndConstraint.first, primaryTypeTraits, primaryComparatorFactories, lowKeyFields,
                 highKeyFields, true, true, new BTreeDataflowHelperFactory(), NoOpOperationCallbackProvider.INSTANCE);
         AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, primarySearchOp,
                 primarySplitsAndConstraint.second);

         // ---------- END PRIMARY INDEX SCAN

         // ---------- START ASSIGN OP

         List<String> secondaryKeyFields = createIndexStmt.getKeyFields();
         int numSecondaryKeys = secondaryKeyFields.size();
         ISerializerDeserializer[] secondaryRecFields = new ISerializerDeserializer[numPrimaryKeys + numSecondaryKeys];
         IEvaluatorFactory[] evalFactories = new IEvaluatorFactory[numSecondaryKeys];
         for (i = 0; i < numSecondaryKeys; i++) {
             evalFactories[i] = metadata.getFormat().getFieldAccessEvaluatorFactory(itemType,
                     secondaryKeyFields.get(i), numPrimaryKeys);
             IAType keyType = AqlCompiledIndexDecl.keyFieldType(secondaryKeyFields.get(i), itemType);
             ISerializerDeserializer keySerde = serdeProvider.getSerializerDeserializer(keyType);
             secondaryRecFields[i] = keySerde;
         }
         // fill in serializers and comparators for primary index fields
         for (i = 0; i < numPrimaryKeys; i++) {
             secondaryRecFields[numSecondaryKeys + i] = primaryRecFields[i];
         }
         RecordDescriptor secondaryRecDesc = new RecordDescriptor(secondaryRecFields);

         int[] outColumns = new int[numSecondaryKeys];
         int[] projectionList = new int[numSecondaryKeys + numPrimaryKeys];
         for (i = 0; i < numSecondaryKeys; i++) {
             outColumns[i] = numPrimaryKeys + i + 1;
         }
         int projCount = 0;
         for (i = 0; i < numSecondaryKeys; i++) {
             projectionList[projCount++] = numPrimaryKeys + i + 1;
         }
         for (i = 0; i < numPrimaryKeys; i++) {
             projectionList[projCount++] = i;
         }

         Pair<IFileSplitProvider, AlgebricksPartitionConstraint> assignSplitsAndConstraint = metadata
                 .splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

         AssignRuntimeFactory assign = new AssignRuntimeFactory(outColumns, evalFactories, projectionList);
         AlgebricksMetaOperatorDescriptor asterixAssignOp = new AlgebricksMetaOperatorDescriptor(spec, 1, 1,
                 new IPushRuntimeFactory[] { assign }, new RecordDescriptor[] { secondaryRecDesc });
         AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, asterixAssignOp,
                 assignSplitsAndConstraint.second);

         // ---------- END ASSIGN OP

         // ---------- START TOKENIZER OP

         int numTokenKeyPairFields = numPrimaryKeys + 1;

         ISerializerDeserializer[] tokenKeyPairFields = new ISerializerDeserializer[numTokenKeyPairFields];
         tokenKeyPairFields[0] = serdeProvider.getSerializerDeserializer(fieldsToTokenizeType);
         for (i = 0; i < numPrimaryKeys; i++)
             tokenKeyPairFields[i + 1] = secondaryRecFields[numSecondaryKeys + i];
         RecordDescriptor tokenKeyPairRecDesc = new RecordDescriptor(tokenKeyPairFields);

         int[] fieldsToTokenize = new int[numSecondaryKeys];
         for (i = 0; i < numSecondaryKeys; i++)
             fieldsToTokenize[i] = i;

         int[] primaryKeyFields = new int[numPrimaryKeys];
         for (i = 0; i < numPrimaryKeys; i++)
             primaryKeyFields[i] = numSecondaryKeys + i;

         IBinaryTokenizerFactory tokenizerFactory = AqlBinaryTokenizerFactoryProvider.INSTANCE
                 .getTokenizerFactory(fieldsToTokenizeType);
         BinaryTokenizerOperatorDescriptor tokenizerOp = new BinaryTokenizerOperatorDescriptor(spec,
                 tokenKeyPairRecDesc, tokenizerFactory, fieldsToTokenize, primaryKeyFields);
         Pair<IFileSplitProvider, AlgebricksPartitionConstraint> secondarySplitsAndConstraint = metadata
                 .splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, secondaryIndexName);
         AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, tokenizerOp,
                 secondarySplitsAndConstraint.second);

         // ---------- END TOKENIZER OP

         // ---------- START EXTERNAL SORT OP

         IBinaryComparatorFactory[] tokenKeyPairComparatorFactories = new IBinaryComparatorFactory[numTokenKeyPairFields];
 		tokenKeyPairComparatorFactories[0] = AqlBinaryComparatorFactoryProvider.INSTANCE
 				.getBinaryComparatorFactory(fieldsToTokenizeType, true);
         for (i = 0; i < numPrimaryKeys; i++) {
             tokenKeyPairComparatorFactories[i + 1] = primaryComparatorFactories[i];
         }

         // <token, primarykey a, primarykey b, etc.>
         int[] sortFields = new int[numTokenKeyPairFields];
         for (i = 0; i < numTokenKeyPairFields; i++) {
             sortFields[i] = i;
         }

         Pair<IFileSplitProvider, AlgebricksPartitionConstraint> sorterSplitsAndConstraint = metadata
                 .splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

         ExternalSortOperatorDescriptor sortOp = new ExternalSortOperatorDescriptor(spec,
                 physOptConf.getMaxFramesExternalSort(), sortFields, tokenKeyPairComparatorFactories,
                 secondaryRecDesc);
         AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, sortOp,
                 sorterSplitsAndConstraint.second);

         // ---------- END EXTERNAL SORT OP

         // ---------- START SECONDARY INDEX BULK LOAD

         ITypeTraits[] secondaryTypeTraits = new ITypeTraits[numTokenKeyPairFields];
         secondaryTypeTraits[0] = AqlTypeTraitProvider.INSTANCE.getTypeTrait(fieldsToTokenizeType);
         for (i = 0; i < numPrimaryKeys; i++)
             secondaryTypeTraits[i + 1] = primaryTypeTraits[i];

         int[] fieldPermutation = new int[numSecondaryKeys + numPrimaryKeys];
         for (i = 0; i < numTokenKeyPairFields; i++)
             fieldPermutation[i] = i;

         TreeIndexBulkLoadOperatorDescriptor secondaryBulkLoadOp = new TreeIndexBulkLoadOperatorDescriptor(
                 spec, storageManager, treeRegistryProvider,
                 secondarySplitsAndConstraint.first, secondaryTypeTraits,
                 tokenKeyPairComparatorFactories, fieldPermutation, 0.7f,
                 new BTreeDataflowHelperFactory(),
                 NoOpOperationCallbackProvider.INSTANCE);
         AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, secondaryBulkLoadOp,
                 secondarySplitsAndConstraint.second);

         // ---------- END SECONDARY INDEX BULK LOAD

         // ---------- START CONNECT THE OPERATORS

         spec.connect(new OneToOneConnectorDescriptor(spec), keyProviderOp, 0, primarySearchOp, 0);

         spec.connect(new OneToOneConnectorDescriptor(spec), primarySearchOp, 0, asterixAssignOp, 0);

         spec.connect(new OneToOneConnectorDescriptor(spec), asterixAssignOp, 0, tokenizerOp, 0);

         spec.connect(new OneToOneConnectorDescriptor(spec), tokenizerOp, 0, sortOp, 0);

         spec.connect(new OneToOneConnectorDescriptor(spec), sortOp, 0, secondaryBulkLoadOp, 0);

         spec.addRoot(secondaryBulkLoadOp);

         // ---------- END CONNECT THE OPERATORS
         spec.setConnectorPolicyAssignmentPolicy(new ConnectorPolicyAssignmentPolicy());
         return spec;
         */
         return null;
     }
 }
	package edu.uci.ics.asterix.file;

	import edu.uci.ics.asterix.common.exceptions.AsterixException;
	import edu.uci.ics.hyracks.algebricks.common.exceptions.AlgebricksException;
	import edu.uci.ics.hyracks.algebricks.core.rewriter.base.PhysicalOptimizationConfig;
	import edu.uci.ics.hyracks.api.job.JobSpecification;

	public class SecondaryInvertedIndexCreator extends SecondaryIndexCreator {

	protected SecondaryInvertedIndexCreator(PhysicalOptimizationConfig physOptConf) {
	super(physOptConf);
	}

	@Override
	public JobSpecification buildCreationJobSpec() throws AsterixException, AlgebricksException {
	// TODO Auto-generated method stub
	return null;
	}

	@Override
	// TODO: This code has been completely rewritten in the asterix-fuzzy branch. No tests currently rely
	// on this code, so I didn't do any cleanup here.
	public JobSpecification buildLoadingJobSpec() throws AsterixException, AlgebricksException {
	/*
	JobSpecification spec = new JobSpecification();

	String primaryIndexName = createIndexStmt.getDatasetName();
	String secondaryIndexName = createIndexStmt.getIndexName();

	AqlCompiledDatasetDecl compiledDatasetDecl = metadata.findDataset(primaryIndexName);
	if (compiledDatasetDecl == null) {
	throw new AsterixException("Could not find dataset " + primaryIndexName);
	}

	if (compiledDatasetDecl.getDatasetType() == DatasetType.EXTERNAL) {
	throw new AsterixException("Cannot index an external dataset (" + primaryIndexName + ").");
	}
	ARecordType itemType = (ARecordType) metadata.findType(compiledDatasetDecl.getItemTypeName());
	ISerializerDeserializerProvider serdeProvider = metadata.getFormat().getSerdeProvider();
	ISerializerDeserializer payloadSerde = serdeProvider.getSerializerDeserializer(itemType);

	int numPrimaryKeys = DatasetUtils.getPartitioningFunctions(compiledDatasetDecl).size();

	// sanity
	if (numPrimaryKeys > 1)
	throw new AsterixException("Cannot create inverted keyword index on dataset with composite primary key.");

	// sanity
	IAType fieldsToTokenizeType = AqlCompiledIndexDecl
	.keyFieldType(createIndexStmt.getKeyFields().get(0), itemType);
	for (String fieldName : createIndexStmt.getKeyFields()) {
	IAType nextFieldToTokenizeType = AqlCompiledIndexDecl.keyFieldType(fieldName, itemType);
	if (nextFieldToTokenizeType.getTypeTag() != fieldsToTokenizeType.getTypeTag()) {
	throw new AsterixException(
	"Cannot create inverted keyword index. Fields to tokenize must be of the same type.");
	}
	}

	// ---------- START GENERAL BTREE STUFF

	IIndexRegistryProvider<IIndex> treeRegistryProvider = AsterixIndexRegistryProvider.INSTANCE;
	IStorageManagerInterface storageManager = AsterixStorageManagerInterface.INSTANCE;

	// ---------- END GENERAL BTREE STUFF

	// ---------- START KEY PROVIDER OP

	// TODO: should actually be empty tuple source
	// build tuple containing low and high search keys
	ArrayTupleBuilder tb = new ArrayTupleBuilder(1); // just one dummy field
	DataOutput dos = tb.getDataOutput();

	try {
	tb.reset();
	IntegerSerializerDeserializer.INSTANCE.serialize(0, dos); // dummy
	// field
	tb.addFieldEndOffset();
	} catch (HyracksDataException e) {
	throw new AsterixException(e);
	}

	ISerializerDeserializer[] keyRecDescSers = { IntegerSerializerDeserializer.INSTANCE };
	RecordDescriptor keyRecDesc = new RecordDescriptor(keyRecDescSers);

	Pair<IFileSplitProvider, AlgebricksPartitionConstraint> keyProviderSplitsAndConstraint = metadata
	.splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

	ConstantTupleSourceOperatorDescriptor keyProviderOp = new ConstantTupleSourceOperatorDescriptor(spec,
	keyRecDesc, tb.getFieldEndOffsets(), tb.getByteArray(), tb.getSize());
	AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, keyProviderOp,
	keyProviderSplitsAndConstraint.second);

	// ---------- END KEY PROVIDER OP

	// ---------- START PRIMARY INDEX SCAN

	ISerializerDeserializer[] primaryRecFields = new ISerializerDeserializer[numPrimaryKeys + 1];
	IBinaryComparatorFactory[] primaryComparatorFactories = new IBinaryComparatorFactory[numPrimaryKeys];
	ITypeTraits[] primaryTypeTraits = new ITypeTraits[numPrimaryKeys + 1];
	int i = 0;
	for (Triple<IEvaluatorFactory, ScalarFunctionCallExpression, IAType> evalFactoryAndType : DatasetUtils
	.getPartitioningFunctions(compiledDatasetDecl)) {
	IAType keyType = evalFactoryAndType.third;
	ISerializerDeserializer keySerde = serdeProvider.getSerializerDeserializer(keyType);
	primaryRecFields[i] = keySerde;
	primaryComparatorFactories[i] = AqlBinaryComparatorFactoryProvider.INSTANCE
	.getBinaryComparatorFactory(keyType, true);
	primaryTypeTraits[i] = AqlTypeTraitProvider.INSTANCE.getTypeTrait(keyType);
	++i;
	}
	primaryRecFields[numPrimaryKeys] = payloadSerde;
	primaryTypeTraits[numPrimaryKeys] = AqlTypeTraitProvider.INSTANCE.getTypeTrait(itemType);

	int[] lowKeyFields = null; // -infinity
	int[] highKeyFields = null; // +infinity
	RecordDescriptor primaryRecDesc = new RecordDescriptor(primaryRecFields);

	Pair<IFileSplitProvider, AlgebricksPartitionConstraint> primarySplitsAndConstraint = metadata
	.splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

	BTreeSearchOperatorDescriptor primarySearchOp = new BTreeSearchOperatorDescriptor(spec, primaryRecDesc,
	storageManager, treeRegistryProvider, primarySplitsAndConstraint.first, primaryTypeTraits, primaryComparatorFactories, lowKeyFields,
	highKeyFields, true, true, new BTreeDataflowHelperFactory(), NoOpOperationCallbackProvider.INSTANCE);
	AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, primarySearchOp,
	primarySplitsAndConstraint.second);

	// ---------- END PRIMARY INDEX SCAN

	// ---------- START ASSIGN OP

	List<String> secondaryKeyFields = createIndexStmt.getKeyFields();
	int numSecondaryKeys = secondaryKeyFields.size();
	ISerializerDeserializer[] secondaryRecFields = new ISerializerDeserializer[numPrimaryKeys + numSecondaryKeys];
	IEvaluatorFactory[] evalFactories = new IEvaluatorFactory[numSecondaryKeys];
	for (i = 0; i < numSecondaryKeys; i++) {
	evalFactories[i] = metadata.getFormat().getFieldAccessEvaluatorFactory(itemType,
	secondaryKeyFields.get(i), numPrimaryKeys);
	IAType keyType = AqlCompiledIndexDecl.keyFieldType(secondaryKeyFields.get(i), itemType);
	ISerializerDeserializer keySerde = serdeProvider.getSerializerDeserializer(keyType);
	secondaryRecFields[i] = keySerde;
	}
	// fill in serializers and comparators for primary index fields
	for (i = 0; i < numPrimaryKeys; i++) {
	secondaryRecFields[numSecondaryKeys + i] = primaryRecFields[i];
	}
	RecordDescriptor secondaryRecDesc = new RecordDescriptor(secondaryRecFields);

	int[] outColumns = new int[numSecondaryKeys];
	int[] projectionList = new int[numSecondaryKeys + numPrimaryKeys];
	for (i = 0; i < numSecondaryKeys; i++) {
	outColumns[i] = numPrimaryKeys + i + 1;
	}
	int projCount = 0;
	for (i = 0; i < numSecondaryKeys; i++) {
	projectionList[projCount++] = numPrimaryKeys + i + 1;
	}
	for (i = 0; i < numPrimaryKeys; i++) {
	projectionList[projCount++] = i;
	}

	Pair<IFileSplitProvider, AlgebricksPartitionConstraint> assignSplitsAndConstraint = metadata
	.splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

	AssignRuntimeFactory assign = new AssignRuntimeFactory(outColumns, evalFactories, projectionList);
	AlgebricksMetaOperatorDescriptor asterixAssignOp = new AlgebricksMetaOperatorDescriptor(spec, 1, 1,
	new IPushRuntimeFactory[] { assign }, new RecordDescriptor[] { secondaryRecDesc });
	AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, asterixAssignOp,
	assignSplitsAndConstraint.second);

	// ---------- END ASSIGN OP

	// ---------- START TOKENIZER OP

	int numTokenKeyPairFields = numPrimaryKeys + 1;

	ISerializerDeserializer[] tokenKeyPairFields = new ISerializerDeserializer[numTokenKeyPairFields];
	tokenKeyPairFields[0] = serdeProvider.getSerializerDeserializer(fieldsToTokenizeType);
	for (i = 0; i < numPrimaryKeys; i++)
	tokenKeyPairFields[i + 1] = secondaryRecFields[numSecondaryKeys + i];
	RecordDescriptor tokenKeyPairRecDesc = new RecordDescriptor(tokenKeyPairFields);

	int[] fieldsToTokenize = new int[numSecondaryKeys];
	for (i = 0; i < numSecondaryKeys; i++)
	fieldsToTokenize[i] = i;

	int[] primaryKeyFields = new int[numPrimaryKeys];
	for (i = 0; i < numPrimaryKeys; i++)
	primaryKeyFields[i] = numSecondaryKeys + i;

	IBinaryTokenizerFactory tokenizerFactory = AqlBinaryTokenizerFactoryProvider.INSTANCE
	.getTokenizerFactory(fieldsToTokenizeType);
	BinaryTokenizerOperatorDescriptor tokenizerOp = new BinaryTokenizerOperatorDescriptor(spec,
	tokenKeyPairRecDesc, tokenizerFactory, fieldsToTokenize, primaryKeyFields);
	Pair<IFileSplitProvider, AlgebricksPartitionConstraint> secondarySplitsAndConstraint = metadata
	.splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, secondaryIndexName);
	AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, tokenizerOp,
	secondarySplitsAndConstraint.second);

	// ---------- END TOKENIZER OP

	// ---------- START EXTERNAL SORT OP

	IBinaryComparatorFactory[] tokenKeyPairComparatorFactories = new IBinaryComparatorFactory[numTokenKeyPairFields];
	tokenKeyPairComparatorFactories[0] = AqlBinaryComparatorFactoryProvider.INSTANCE
	.getBinaryComparatorFactory(fieldsToTokenizeType, true);
	for (i = 0; i < numPrimaryKeys; i++) {
	tokenKeyPairComparatorFactories[i + 1] = primaryComparatorFactories[i];
	}

	// <token, primarykey a, primarykey b, etc.>
	int[] sortFields = new int[numTokenKeyPairFields];
	for (i = 0; i < numTokenKeyPairFields; i++) {
	sortFields[i] = i;
	}

	Pair<IFileSplitProvider, AlgebricksPartitionConstraint> sorterSplitsAndConstraint = metadata
	.splitProviderAndPartitionConstraintsForInternalOrFeedDataset(primaryIndexName, primaryIndexName);

	ExternalSortOperatorDescriptor sortOp = new ExternalSortOperatorDescriptor(spec,
	physOptConf.getMaxFramesExternalSort(), sortFields, tokenKeyPairComparatorFactories,
	secondaryRecDesc);
	AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, sortOp,
	sorterSplitsAndConstraint.second);

	// ---------- END EXTERNAL SORT OP

	// ---------- START SECONDARY INDEX BULK LOAD

	ITypeTraits[] secondaryTypeTraits = new ITypeTraits[numTokenKeyPairFields];
	secondaryTypeTraits[0] = AqlTypeTraitProvider.INSTANCE.getTypeTrait(fieldsToTokenizeType);
	for (i = 0; i < numPrimaryKeys; i++)
	secondaryTypeTraits[i + 1] = primaryTypeTraits[i];

	int[] fieldPermutation = new int[numSecondaryKeys + numPrimaryKeys];
	for (i = 0; i < numTokenKeyPairFields; i++)
	fieldPermutation[i] = i;

	TreeIndexBulkLoadOperatorDescriptor secondaryBulkLoadOp = new TreeIndexBulkLoadOperatorDescriptor(
	spec, storageManager, treeRegistryProvider,
	secondarySplitsAndConstraint.first, secondaryTypeTraits,
	tokenKeyPairComparatorFactories, fieldPermutation, 0.7f,
	new BTreeDataflowHelperFactory(),
	NoOpOperationCallbackProvider.INSTANCE);
	AlgebricksPartitionConstraintHelper.setPartitionConstraintInJobSpec(spec, secondaryBulkLoadOp,
	secondarySplitsAndConstraint.second);

	// ---------- END SECONDARY INDEX BULK LOAD

	// ---------- START CONNECT THE OPERATORS

	spec.connect(new OneToOneConnectorDescriptor(spec), keyProviderOp, 0, primarySearchOp, 0);

	spec.connect(new OneToOneConnectorDescriptor(spec), primarySearchOp, 0, asterixAssignOp, 0);

	spec.connect(new OneToOneConnectorDescriptor(spec), asterixAssignOp, 0, tokenizerOp, 0);

	spec.connect(new OneToOneConnectorDescriptor(spec), tokenizerOp, 0, sortOp, 0);

	spec.connect(new OneToOneConnectorDescriptor(spec), sortOp, 0, secondaryBulkLoadOp, 0);

	spec.addRoot(secondaryBulkLoadOp);

	// ---------- END CONNECT THE OPERATORS
	spec.setConnectorPolicyAssignmentPolicy(new ConnectorPolicyAssignmentPolicy());
	return spec;
	*/
	return null;
	}
	}