lucene/core/src/test/org/apache/lucene/search/TestKnnVectorQuery.java - lucene - Git at Google

 /*
  * Licensed to the Apache Software Foundation (ASF) under one or more
  * contributor license agreements.  See the NOTICE file distributed with
  * this work for additional information regarding copyright ownership.
  * The ASF licenses this file to You under the Apache License, Version 2.0
  * (the "License"); you may not use this file except in compliance with
  * the License.  You may obtain a copy of the License at
  *
  *     http://www.apache.org/licenses/LICENSE-2.0
  *
  * Unless required by applicable law or agreed to in writing, software
  * distributed under the License is distributed on an "AS IS" BASIS,
  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */
 package org.apache.lucene.search;

 import static com.carrotsearch.randomizedtesting.RandomizedTest.frequently;
 import static org.apache.lucene.index.VectorSimilarityFunction.COSINE;
 import static org.apache.lucene.index.VectorSimilarityFunction.DOT_PRODUCT;
 import static org.apache.lucene.index.VectorSimilarityFunction.EUCLIDEAN;
 import static org.apache.lucene.search.DocIdSetIterator.NO_MORE_DOCS;
 import static org.apache.lucene.util.TestVectorUtil.randomVector;

 import java.io.IOException;
 import java.util.HashSet;
 import java.util.Set;
 import org.apache.lucene.document.Document;
 import org.apache.lucene.document.Field;
 import org.apache.lucene.document.IntPoint;
 import org.apache.lucene.document.KnnVectorField;
 import org.apache.lucene.document.NumericDocValuesField;
 import org.apache.lucene.document.StringField;
 import org.apache.lucene.index.DirectoryReader;
 import org.apache.lucene.index.FilterDirectoryReader;
 import org.apache.lucene.index.FilterLeafReader;
 import org.apache.lucene.index.IndexReader;
 import org.apache.lucene.index.IndexWriter;
 import org.apache.lucene.index.IndexWriterConfig;
 import org.apache.lucene.index.LeafReader;
 import org.apache.lucene.index.LeafReaderContext;
 import org.apache.lucene.index.Term;
 import org.apache.lucene.index.VectorEncoding;
 import org.apache.lucene.store.Directory;
 import org.apache.lucene.tests.index.RandomIndexWriter;
 import org.apache.lucene.tests.util.LuceneTestCase;
 import org.apache.lucene.tests.util.TestUtil;
 import org.apache.lucene.util.BitSet;
 import org.apache.lucene.util.BitSetIterator;
 import org.apache.lucene.util.Bits;
 import org.apache.lucene.util.BytesRef;
 import org.apache.lucene.util.FixedBitSet;
 import org.apache.lucene.util.VectorUtil;

 /** TestKnnVectorQuery tests KnnVectorQuery. */
 public class TestKnnVectorQuery extends LuceneTestCase {

   public void testEquals() {
     KnnVectorQuery q1 = new KnnVectorQuery("f1", new float[] {0, 1}, 10);
     Query filter1 = new TermQuery(new Term("id", "id1"));
     KnnVectorQuery q2 = new KnnVectorQuery("f1", new float[] {0, 1}, 10, filter1);

     assertNotEquals(q2, q1);
     assertNotEquals(q1, q2);
     assertEquals(q2, new KnnVectorQuery("f1", new float[] {0, 1}, 10, filter1));

     Query filter2 = new TermQuery(new Term("id", "id2"));
     assertNotEquals(q2, new KnnVectorQuery("f1", new float[] {0, 1}, 10, filter2));

     assertEquals(q1, new KnnVectorQuery("f1", new float[] {0, 1}, 10));

     assertNotEquals(null, q1);

     assertNotEquals(q1, new TermQuery(new Term("f1", "x")));

     assertNotEquals(q1, new KnnVectorQuery("f2", new float[] {0, 1}, 10));
     assertNotEquals(q1, new KnnVectorQuery("f1", new float[] {1, 1}, 10));
     assertNotEquals(q1, new KnnVectorQuery("f1", new float[] {0, 1}, 2));
     assertNotEquals(q1, new KnnVectorQuery("f1", new float[] {0}, 10));
   }

   public void testToString() {
     KnnVectorQuery q1 = new KnnVectorQuery("f1", new float[] {0, 1}, 10);
     assertEquals("KnnVectorQuery:f1[0.0,...][10]", q1.toString("ignored"));
   }

   /**
    * Tests if a KnnVectorQuery is rewritten to a MatchNoDocsQuery when there are no documents to
    * match.
    */
   public void testEmptyIndex() throws IOException {
     try (Directory indexStore = getIndexStore("field");
         IndexReader reader = DirectoryReader.open(indexStore)) {
       IndexSearcher searcher = newSearcher(reader);
       KnnVectorQuery kvq = new KnnVectorQuery("field", new float[] {1, 2}, 10);
       assertMatches(searcher, kvq, 0);
       Query q = searcher.rewrite(kvq);
       assertTrue(q instanceof MatchNoDocsQuery);
     }
   }

   /**
    * Tests that a KnnVectorQuery whose topK &gt;= numDocs returns all the documents in score order
    */
   public void testFindAll() throws IOException {
     try (Directory indexStore =
             getIndexStore("field", new float[] {0, 1}, new float[] {1, 2}, new float[] {0, 0});
         IndexReader reader = DirectoryReader.open(indexStore)) {
       IndexSearcher searcher = newSearcher(reader);
       KnnVectorQuery kvq = new KnnVectorQuery("field", new float[] {0, 0}, 10);
       assertMatches(searcher, kvq, 3);
       ScoreDoc[] scoreDocs = searcher.search(kvq, 3).scoreDocs;
       assertIdMatches(reader, "id2", scoreDocs[0]);
       assertIdMatches(reader, "id0", scoreDocs[1]);
       assertIdMatches(reader, "id1", scoreDocs[2]);
     }
   }

   public void testSearchBoost() throws IOException {
     try (Directory indexStore =
             getIndexStore("field", new float[] {0, 1}, new float[] {1, 2}, new float[] {0, 0});
         IndexReader reader = DirectoryReader.open(indexStore)) {
       IndexSearcher searcher = newSearcher(reader);

       Query vectorQuery = new KnnVectorQuery("field", new float[] {0, 0}, 10);
       ScoreDoc[] scoreDocs = searcher.search(vectorQuery, 3).scoreDocs;

       Query boostQuery = new BoostQuery(vectorQuery, 3.0f);
       ScoreDoc[] boostScoreDocs = searcher.search(boostQuery, 3).scoreDocs;
       assertEquals(scoreDocs.length, boostScoreDocs.length);

       for (int i = 0; i < scoreDocs.length; i++) {
         ScoreDoc scoreDoc = scoreDocs[i];
         ScoreDoc boostScoreDoc = boostScoreDocs[i];

         assertEquals(scoreDoc.doc, boostScoreDoc.doc);
         assertEquals(scoreDoc.score * 3.0f, boostScoreDoc.score, 0.001f);
       }
     }
   }

   /** Tests that a KnnVectorQuery applies the filter query */
   public void testSimpleFilter() throws IOException {
     try (Directory indexStore =
             getIndexStore("field", new float[] {0, 1}, new float[] {1, 2}, new float[] {0, 0});
         IndexReader reader = DirectoryReader.open(indexStore)) {
       IndexSearcher searcher = newSearcher(reader);
       Query filter = new TermQuery(new Term("id", "id2"));
       Query kvq = new KnnVectorQuery("field", new float[] {0, 0}, 10, filter);
       TopDocs topDocs = searcher.search(kvq, 3);
       assertEquals(1, topDocs.totalHits.value);
       assertIdMatches(reader, "id2", topDocs.scoreDocs[0]);
     }
   }

   public void testFilterWithNoVectorMatches() throws IOException {
     try (Directory indexStore =
             getIndexStore("field", new float[] {0, 1}, new float[] {1, 2}, new float[] {0, 0});
         IndexReader reader = DirectoryReader.open(indexStore)) {
       IndexSearcher searcher = newSearcher(reader);

       Query filter = new TermQuery(new Term("other", "value"));
       Query kvq = new KnnVectorQuery("field", new float[] {0, 0}, 10, filter);
       TopDocs topDocs = searcher.search(kvq, 3);
       assertEquals(0, topDocs.totalHits.value);
     }
   }

   /** testDimensionMismatch */
   public void testDimensionMismatch() throws IOException {
     try (Directory indexStore =
             getIndexStore("field", new float[] {0, 1}, new float[] {1, 2}, new float[] {0, 0});
         IndexReader reader = DirectoryReader.open(indexStore)) {
       IndexSearcher searcher = newSearcher(reader);
       KnnVectorQuery kvq = new KnnVectorQuery("field", new float[] {0}, 10);
       IllegalArgumentException e =
           expectThrows(IllegalArgumentException.class, () -> searcher.search(kvq, 10));
       assertEquals("vector query dimension: 1 differs from field dimension: 2", e.getMessage());
     }
   }

   /** testNonVectorField */
   public void testNonVectorField() throws IOException {
     try (Directory indexStore =
             getIndexStore("field", new float[] {0, 1}, new float[] {1, 2}, new float[] {0, 0});
         IndexReader reader = DirectoryReader.open(indexStore)) {
       IndexSearcher searcher = newSearcher(reader);
       assertMatches(searcher, new KnnVectorQuery("xyzzy", new float[] {0}, 10), 0);
       assertMatches(searcher, new KnnVectorQuery("id", new float[] {0}, 10), 0);
     }
   }

   /** Test bad parameters */
   public void testIllegalArguments() throws IOException {
     expectThrows(
         IllegalArgumentException.class, () -> new KnnVectorQuery("xx", new float[] {1}, 0));
   }

   public void testDifferentReader() throws IOException {
     try (Directory indexStore =
             getIndexStore("field", new float[] {0, 1}, new float[] {1, 2}, new float[] {0, 0});
         IndexReader reader = DirectoryReader.open(indexStore)) {
       KnnVectorQuery query = new KnnVectorQuery("field", new float[] {2, 3}, 3);
       Query dasq = query.rewrite(reader);
       IndexSearcher leafSearcher = newSearcher(reader.leaves().get(0).reader());
       expectThrows(
           IllegalStateException.class,
           () -> dasq.createWeight(leafSearcher, ScoreMode.COMPLETE, 1));
     }
   }

   public void testAdvanceShallow() throws IOException {
     try (Directory d = newDirectory()) {
       try (IndexWriter w = new IndexWriter(d, new IndexWriterConfig())) {
         for (int j = 0; j < 5; j++) {
           Document doc = new Document();
           doc.add(new KnnVectorField("field", new float[] {j, j}));
           w.addDocument(doc);
         }
       }
       try (IndexReader reader = DirectoryReader.open(d)) {
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query = new KnnVectorQuery("field", new float[] {2, 3}, 3);
         Query dasq = query.rewrite(reader);
         Scorer scorer =
             dasq.createWeight(searcher, ScoreMode.COMPLETE, 1).scorer(reader.leaves().get(0));
         // before advancing the iterator
         assertEquals(1, scorer.advanceShallow(0));
         assertEquals(1, scorer.advanceShallow(1));
         assertEquals(NO_MORE_DOCS, scorer.advanceShallow(10));

         // after advancing the iterator
         scorer.iterator().advance(2);
         assertEquals(2, scorer.advanceShallow(0));
         assertEquals(2, scorer.advanceShallow(2));
         assertEquals(3, scorer.advanceShallow(3));
         assertEquals(NO_MORE_DOCS, scorer.advanceShallow(10));
       }
     }
   }

   public void testScoreEuclidean() throws IOException {
     float[][] vectors = new float[5][];
     for (int j = 0; j < 5; j++) {
       vectors[j] = new float[] {j, j};
     }
     try (Directory d = getIndexStore("field", vectors);
         IndexReader reader = DirectoryReader.open(d)) {
       assertEquals(1, reader.leaves().size());
       IndexSearcher searcher = new IndexSearcher(reader);
       KnnVectorQuery query = new KnnVectorQuery("field", new float[] {2, 3}, 3);
       Query rewritten = query.rewrite(reader);
       Weight weight = searcher.createWeight(rewritten, ScoreMode.COMPLETE, 1);
       Scorer scorer = weight.scorer(reader.leaves().get(0));

       // prior to advancing, score is 0
       assertEquals(-1, scorer.docID());
       expectThrows(ArrayIndexOutOfBoundsException.class, scorer::score);

       // test getMaxScore
       assertEquals(0, scorer.getMaxScore(-1), 0);
       assertEquals(0, scorer.getMaxScore(0), 0);
       // This is 1 / ((l2distance((2,3), (2, 2)) = 1) + 1) = 0.5
       assertEquals(1 / 2f, scorer.getMaxScore(2), 0);
       assertEquals(1 / 2f, scorer.getMaxScore(Integer.MAX_VALUE), 0);

       DocIdSetIterator it = scorer.iterator();
       assertEquals(3, it.cost());
       assertEquals(1, it.nextDoc());
       assertEquals(1 / 6f, scorer.score(), 0);
       assertEquals(3, it.advance(3));
       assertEquals(1 / 2f, scorer.score(), 0);
       assertEquals(NO_MORE_DOCS, it.advance(4));
       expectThrows(ArrayIndexOutOfBoundsException.class, scorer::score);
     }
   }

   public void testScoreDotProduct() throws IOException {
     try (Directory d = newDirectory()) {
       try (IndexWriter w = new IndexWriter(d, new IndexWriterConfig())) {
         for (int j = 1; j <= 5; j++) {
           Document doc = new Document();
           doc.add(
               new KnnVectorField(
                   "field", VectorUtil.l2normalize(new float[] {j, j * j}), DOT_PRODUCT));
           w.addDocument(doc);
         }
       }
       try (IndexReader reader = DirectoryReader.open(d)) {
         assertEquals(1, reader.leaves().size());
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query =
             new KnnVectorQuery("field", VectorUtil.l2normalize(new float[] {2, 3}), 3);
         Query rewritten = query.rewrite(reader);
         Weight weight = searcher.createWeight(rewritten, ScoreMode.COMPLETE, 1);
         Scorer scorer = weight.scorer(reader.leaves().get(0));

         // prior to advancing, score is undefined
         assertEquals(-1, scorer.docID());
         expectThrows(ArrayIndexOutOfBoundsException.class, scorer::score);

         // test getMaxScore
         assertEquals(0, scorer.getMaxScore(-1), 0);
         /* maxAtZero = ((2,3) * (1, 1) = 5) / (||2, 3|| * ||1, 1|| = sqrt(26)), then
          * normalized by (1 + x) /2.
          */
         float maxAtZero =
             (float) ((1 + (2 * 1 + 3 * 1) / Math.sqrt((2 * 2 + 3 * 3) * (1 * 1 + 1 * 1))) / 2);
         assertEquals(maxAtZero, scorer.getMaxScore(0), 0.001);

         /* max at 2 is actually the score for doc 1 which is the highest (since doc 1 vector (2, 4)
          * is the closest to (2, 3)). This is ((2,3) * (2, 4) = 16) / (||2, 3|| * ||2, 4|| = sqrt(260)), then
          * normalized by (1 + x) /2
          */
         float expected =
             (float) ((1 + (2 * 2 + 3 * 4) / Math.sqrt((2 * 2 + 3 * 3) * (2 * 2 + 4 * 4))) / 2);
         assertEquals(expected, scorer.getMaxScore(2), 0);
         assertEquals(expected, scorer.getMaxScore(Integer.MAX_VALUE), 0);

         DocIdSetIterator it = scorer.iterator();
         assertEquals(3, it.cost());
         assertEquals(0, it.nextDoc());
         // doc 0 has (1, 1)
         assertEquals(maxAtZero, scorer.score(), 0.0001);
         assertEquals(1, it.advance(1));
         assertEquals(expected, scorer.score(), 0);
         assertEquals(2, it.nextDoc());
         // since topK was 3
         assertEquals(NO_MORE_DOCS, it.advance(4));
         expectThrows(ArrayIndexOutOfBoundsException.class, scorer::score);
       }
     }
   }

   public void testScoreCosine() throws IOException {
     try (Directory d = newDirectory()) {
       try (IndexWriter w = new IndexWriter(d, new IndexWriterConfig())) {
         for (int j = 1; j <= 5; j++) {
           Document doc = new Document();
           doc.add(new KnnVectorField("field", new float[] {j, j * j}, COSINE));
           w.addDocument(doc);
         }
       }
       try (IndexReader reader = DirectoryReader.open(d)) {
         assertEquals(1, reader.leaves().size());
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query = new KnnVectorQuery("field", new float[] {2, 3}, 3);
         Query rewritten = query.rewrite(reader);
         Weight weight = searcher.createWeight(rewritten, ScoreMode.COMPLETE, 1);
         Scorer scorer = weight.scorer(reader.leaves().get(0));

         // prior to advancing, score is undefined
         assertEquals(-1, scorer.docID());
         expectThrows(ArrayIndexOutOfBoundsException.class, scorer::score);

         // test getMaxScore
         assertEquals(0, scorer.getMaxScore(-1), 0);
         /* maxAtZero = ((2,3) * (1, 1) = 5) / (||2, 3|| * ||1, 1|| = sqrt(26)), then
          * normalized by (1 + x) /2.
          */
         float maxAtZero =
             (float) ((1 + (2 * 1 + 3 * 1) / Math.sqrt((2 * 2 + 3 * 3) * (1 * 1 + 1 * 1))) / 2);
         assertEquals(maxAtZero, scorer.getMaxScore(0), 0.001);

         /* max at 2 is actually the score for doc 1 which is the highest (since doc 1 vector (2, 4)
          * is the closest to (2, 3)). This is ((2,3) * (2, 4) = 16) / (||2, 3|| * ||2, 4|| = sqrt(260)), then
          * normalized by (1 + x) /2
          */
         float expected =
             (float) ((1 + (2 * 2 + 3 * 4) / Math.sqrt((2 * 2 + 3 * 3) * (2 * 2 + 4 * 4))) / 2);
         assertEquals(expected, scorer.getMaxScore(2), 0);
         assertEquals(expected, scorer.getMaxScore(Integer.MAX_VALUE), 0);

         DocIdSetIterator it = scorer.iterator();
         assertEquals(3, it.cost());
         assertEquals(0, it.nextDoc());
         // doc 0 has (1, 1)
         assertEquals(maxAtZero, scorer.score(), 0.0001);
         assertEquals(1, it.advance(1));
         assertEquals(expected, scorer.score(), 0);
         assertEquals(2, it.nextDoc());
         // since topK was 3
         assertEquals(NO_MORE_DOCS, it.advance(4));
         expectThrows(ArrayIndexOutOfBoundsException.class, scorer::score);
       }
     }
   }

   public void testScoreNegativeDotProduct() throws IOException {
     try (Directory d = newDirectory()) {
       try (IndexWriter w = new IndexWriter(d, new IndexWriterConfig())) {
         Document doc = new Document();
         doc.add(new KnnVectorField("field", new float[] {-1, 0}, DOT_PRODUCT));
         w.addDocument(doc);
         doc = new Document();
         doc.add(new KnnVectorField("field", new float[] {1, 0}, DOT_PRODUCT));
         w.addDocument(doc);
       }
       try (IndexReader reader = DirectoryReader.open(d)) {
         assertEquals(1, reader.leaves().size());
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query = new KnnVectorQuery("field", new float[] {1, 0}, 2);
         Query rewritten = query.rewrite(reader);
         Weight weight = searcher.createWeight(rewritten, ScoreMode.COMPLETE, 1);
         Scorer scorer = weight.scorer(reader.leaves().get(0));

         // scores are normalized to lie in [0, 1]
         DocIdSetIterator it = scorer.iterator();
         assertEquals(2, it.cost());
         assertEquals(0, it.nextDoc());
         assertEquals(0, scorer.score(), 0);
         assertEquals(1, it.advance(1));
         assertEquals(1, scorer.score(), 0);
       }
     }
   }

   public void testExplain() throws IOException {
     try (Directory d = newDirectory()) {
       try (IndexWriter w = new IndexWriter(d, new IndexWriterConfig())) {
         for (int j = 0; j < 5; j++) {
           Document doc = new Document();
           doc.add(new KnnVectorField("field", new float[] {j, j}));
           w.addDocument(doc);
         }
       }
       try (IndexReader reader = DirectoryReader.open(d)) {
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query = new KnnVectorQuery("field", new float[] {2, 3}, 3);
         Explanation matched = searcher.explain(query, 2);
         assertTrue(matched.isMatch());
         assertEquals(1 / 2f, matched.getValue());
         assertEquals(0, matched.getDetails().length);
         assertEquals("within top 3", matched.getDescription());

         Explanation nomatch = searcher.explain(query, 4);
         assertFalse(nomatch.isMatch());
         assertEquals(0f, nomatch.getValue());
         assertEquals(0, matched.getDetails().length);
         assertEquals("not in top 3", nomatch.getDescription());
       }
     }
   }

   public void testExplainMultipleSegments() throws IOException {
     try (Directory d = newDirectory()) {
       try (IndexWriter w = new IndexWriter(d, new IndexWriterConfig())) {
         for (int j = 0; j < 5; j++) {
           Document doc = new Document();
           doc.add(new KnnVectorField("field", new float[] {j, j}));
           w.addDocument(doc);
           w.commit();
         }
       }
       try (IndexReader reader = DirectoryReader.open(d)) {
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query = new KnnVectorQuery("field", new float[] {2, 3}, 3);
         Explanation matched = searcher.explain(query, 2);
         assertTrue(matched.isMatch());
         assertEquals(1 / 2f, matched.getValue());
         assertEquals(0, matched.getDetails().length);
         assertEquals("within top 3", matched.getDescription());

         Explanation nomatch = searcher.explain(query, 4);
         assertFalse(nomatch.isMatch());
         assertEquals(0f, nomatch.getValue());
         assertEquals(0, matched.getDetails().length);
         assertEquals("not in top 3", nomatch.getDescription());
       }
     }
   }

   /** Test that when vectors are abnormally distributed among segments, we still find the top K */
   public void testSkewedIndex() throws IOException {
     /* We have to choose the numbers carefully here so that some segment has more than the expected
      * number of top K documents, but no more than K documents in total (otherwise we might occasionally
      * randomly fail to find one).
      */
     try (Directory d = newDirectory()) {
       try (IndexWriter w = new IndexWriter(d, new IndexWriterConfig())) {
         int r = 0;
         for (int i = 0; i < 5; i++) {
           for (int j = 0; j < 5; j++) {
             Document doc = new Document();
             doc.add(new KnnVectorField("field", new float[] {r, r}));
             doc.add(new StringField("id", "id" + r, Field.Store.YES));
             w.addDocument(doc);
             ++r;
           }
           w.flush();
         }
       }
       try (IndexReader reader = DirectoryReader.open(d)) {
         IndexSearcher searcher = newSearcher(reader);
         TopDocs results = searcher.search(new KnnVectorQuery("field", new float[] {0, 0}, 8), 10);
         assertEquals(8, results.scoreDocs.length);
         assertIdMatches(reader, "id0", results.scoreDocs[0]);
         assertIdMatches(reader, "id7", results.scoreDocs[7]);

         // test some results in the middle of the sequence - also tests docid tiebreaking
         results = searcher.search(new KnnVectorQuery("field", new float[] {10, 10}, 8), 10);
         assertEquals(8, results.scoreDocs.length);
         assertIdMatches(reader, "id10", results.scoreDocs[0]);
         assertIdMatches(reader, "id6", results.scoreDocs[7]);
       }
     }
   }

   /** Tests with random vectors, number of documents, etc. Uses RandomIndexWriter. */
   public void testRandom() throws IOException {
     int numDocs = atLeast(100);
     int dimension = atLeast(5);
     int numIters = atLeast(10);
     boolean everyDocHasAVector = random().nextBoolean();
     try (Directory d = newDirectory()) {
       RandomIndexWriter w = new RandomIndexWriter(random(), d);
       for (int i = 0; i < numDocs; i++) {
         Document doc = new Document();
         if (everyDocHasAVector || random().nextInt(10) != 2) {
           doc.add(new KnnVectorField("field", randomVector(dimension)));
         }
         w.addDocument(doc);
       }
       w.close();
       try (IndexReader reader = DirectoryReader.open(d)) {
         IndexSearcher searcher = newSearcher(reader);
         for (int i = 0; i < numIters; i++) {
           int k = random().nextInt(80) + 1;
           KnnVectorQuery query = new KnnVectorQuery("field", randomVector(dimension), k);
           int n = random().nextInt(100) + 1;
           TopDocs results = searcher.search(query, n);
           int expected = Math.min(Math.min(n, k), reader.numDocs());
           // we may get fewer results than requested if there are deletions, but this test doesn't
           // test that
           assert reader.hasDeletions() == false;
           assertEquals(expected, results.scoreDocs.length);
           assertTrue(results.totalHits.value >= results.scoreDocs.length);
           // verify the results are in descending score order
           float last = Float.MAX_VALUE;
           for (ScoreDoc scoreDoc : results.scoreDocs) {
             assertTrue(scoreDoc.score <= last);
             last = scoreDoc.score;
           }
         }
       }
     }
   }

   /** Tests with random vectors and a random filter. Uses RandomIndexWriter. */
   public void testRandomWithFilter() throws IOException {
     int numDocs = 1000;
     int dimension = atLeast(5);
     int numIters = atLeast(10);
     try (Directory d = newDirectory()) {
       // Always use the default kNN format to have predictable behavior around when it hits
       // visitedLimit. This is fine since the test targets KnnVectorQuery logic, not the kNN format
       // implementation.
       IndexWriterConfig iwc = new IndexWriterConfig().setCodec(TestUtil.getDefaultCodec());
       RandomIndexWriter w = new RandomIndexWriter(random(), d, iwc);
       for (int i = 0; i < numDocs; i++) {
         Document doc = new Document();
         doc.add(new KnnVectorField("field", randomVector(dimension)));
         doc.add(new NumericDocValuesField("tag", i));
         doc.add(new IntPoint("tag", i));
         w.addDocument(doc);
       }
       w.forceMerge(1);
       w.close();

       try (DirectoryReader reader = DirectoryReader.open(d)) {
         IndexSearcher searcher = newSearcher(reader);
         for (int i = 0; i < numIters; i++) {
           int lower = random().nextInt(500);

           // Test a filter with cost less than k and check we use exact search
           Query filter1 = IntPoint.newRangeQuery("tag", lower, lower + 8);
           TopDocs results =
               searcher.search(
                   new KnnVectorQuery("field", randomVector(dimension), 10, filter1), numDocs);
           assertEquals(9, results.totalHits.value);
           assertEquals(results.totalHits.value, results.scoreDocs.length);
           expectThrows(
               UnsupportedOperationException.class,
               () ->
                   searcher.search(
                       new ThrowingKnnVectorQuery("field", randomVector(dimension), 10, filter1),
                       numDocs));

           // Test a restrictive filter and check we use exact search
           Query filter2 = IntPoint.newRangeQuery("tag", lower, lower + 6);
           results =
               searcher.search(
                   new KnnVectorQuery("field", randomVector(dimension), 5, filter2), numDocs);
           assertEquals(5, results.totalHits.value);
           assertEquals(results.totalHits.value, results.scoreDocs.length);
           expectThrows(
               UnsupportedOperationException.class,
               () ->
                   searcher.search(
                       new ThrowingKnnVectorQuery("field", randomVector(dimension), 5, filter2),
                       numDocs));

           // Test an unrestrictive filter and check we use approximate search
           Query filter3 = IntPoint.newRangeQuery("tag", lower, numDocs);
           results =
               searcher.search(
                   new ThrowingKnnVectorQuery("field", randomVector(dimension), 5, filter3),
                   numDocs,
                   new Sort(new SortField("tag", SortField.Type.INT)));
           assertEquals(5, results.totalHits.value);
           assertEquals(results.totalHits.value, results.scoreDocs.length);

           for (ScoreDoc scoreDoc : results.scoreDocs) {
             FieldDoc fieldDoc = (FieldDoc) scoreDoc;
             assertEquals(1, fieldDoc.fields.length);

             int tag = (int) fieldDoc.fields[0];
             assertTrue(lower <= tag && tag <= numDocs);
           }

           // Test a filter that exhausts visitedLimit in upper levels, and switches to exact search
           Query filter4 = IntPoint.newRangeQuery("tag", lower, lower + 2);
           expectThrows(
               UnsupportedOperationException.class,
               () ->
                   searcher.search(
                       new ThrowingKnnVectorQuery("field", randomVector(dimension), 1, filter4),
                       numDocs));
         }
       }
     }
   }

   public void testDeletes() throws IOException {
     try (Directory dir = newDirectory();
         IndexWriter w = new IndexWriter(dir, newIndexWriterConfig())) {
       final int numDocs = atLeast(100);
       final int dim = 30;
       for (int i = 0; i < numDocs; ++i) {
         Document d = new Document();
         d.add(new StringField("index", String.valueOf(i), Field.Store.YES));
         if (frequently()) {
           d.add(new KnnVectorField("vector", randomVector(dim)));
         }
         w.addDocument(d);
       }
       w.commit();

       // Delete some documents at random, both those with and without vectors
       Set<Term> toDelete = new HashSet<>();
       for (int i = 0; i < 25; i++) {
         int index = random().nextInt(numDocs);
         toDelete.add(new Term("index", String.valueOf(index)));
       }
       w.deleteDocuments(toDelete.toArray(new Term[0]));
       w.commit();

       int hits = 50;
       try (IndexReader reader = DirectoryReader.open(dir)) {
         Set<String> allIds = new HashSet<>();
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query = new KnnVectorQuery("vector", randomVector(dim), hits);
         TopDocs topDocs = searcher.search(query, numDocs);
         for (ScoreDoc scoreDoc : topDocs.scoreDocs) {
           Document doc = reader.document(scoreDoc.doc, Set.of("index"));
           String index = doc.get("index");
           assertFalse(
               "search returned a deleted document: " + index,
               toDelete.contains(new Term("index", index)));
           allIds.add(index);
         }
         assertEquals("search missed some documents", hits, allIds.size());
       }
     }
   }

   public void testAllDeletes() throws IOException {
     try (Directory dir = newDirectory();
         IndexWriter w = new IndexWriter(dir, newIndexWriterConfig())) {
       final int numDocs = atLeast(100);
       final int dim = 30;
       for (int i = 0; i < numDocs; ++i) {
         Document d = new Document();
         d.add(new KnnVectorField("vector", randomVector(dim)));
         w.addDocument(d);
       }
       w.commit();

       w.deleteDocuments(new MatchAllDocsQuery());
       w.commit();

       try (IndexReader reader = DirectoryReader.open(dir)) {
         IndexSearcher searcher = new IndexSearcher(reader);
         KnnVectorQuery query = new KnnVectorQuery("vector", randomVector(dim), numDocs);
         TopDocs topDocs = searcher.search(query, numDocs);
         assertEquals(0, topDocs.scoreDocs.length);
       }
     }
   }

   /**
    * Check that the query behaves reasonably when using a custom filter reader where there are no
    * live docs.
    */
   public void testNoLiveDocsReader() throws IOException {
     IndexWriterConfig iwc = newIndexWriterConfig();
     try (Directory dir = newDirectory();
         IndexWriter w = new IndexWriter(dir, iwc)) {
       final int numDocs = 10;
       final int dim = 30;
       for (int i = 0; i < numDocs; ++i) {
         Document d = new Document();
         d.add(new StringField("index", String.valueOf(i), Field.Store.NO));
         d.add(new KnnVectorField("vector", randomVector(dim)));
         w.addDocument(d);
       }
       w.commit();

       try (DirectoryReader reader = DirectoryReader.open(dir)) {
         DirectoryReader wrappedReader = new NoLiveDocsDirectoryReader(reader);
         IndexSearcher searcher = new IndexSearcher(wrappedReader);
         KnnVectorQuery query = new KnnVectorQuery("vector", randomVector(dim), numDocs);
         TopDocs topDocs = searcher.search(query, numDocs);
         assertEquals(0, topDocs.scoreDocs.length);
       }
     }
   }

   /**
    * Test that KnnVectorQuery optimizes the case where the filter query is backed by {@link
    * BitSetIterator}.
    */
   public void testBitSetQuery() throws IOException {
     IndexWriterConfig iwc = newIndexWriterConfig();
     try (Directory dir = newDirectory();
         IndexWriter w = new IndexWriter(dir, iwc)) {
       final int numDocs = 100;
       final int dim = 30;
       for (int i = 0; i < numDocs; ++i) {
         Document d = new Document();
         d.add(new KnnVectorField("vector", randomVector(dim)));
         w.addDocument(d);
       }
       w.commit();

       try (DirectoryReader reader = DirectoryReader.open(dir)) {
         IndexSearcher searcher = new IndexSearcher(reader);

         Query filter = new ThrowingBitSetQuery(new FixedBitSet(numDocs));
         expectThrows(
             UnsupportedOperationException.class,
             () ->
                 searcher.search(
                     new KnnVectorQuery("vector", randomVector(dim), 10, filter), numDocs));
       }
     }
   }

   /** Creates a new directory and adds documents with the given vectors as kNN vector fields */
   private Directory getIndexStore(String field, float[]... contents) throws IOException {
     Directory indexStore = newDirectory();
     RandomIndexWriter writer = new RandomIndexWriter(random(), indexStore);
     VectorEncoding encoding = randomVectorEncoding();
     for (int i = 0; i < contents.length; ++i) {
       Document doc = new Document();
       if (encoding == VectorEncoding.BYTE) {
         BytesRef v = new BytesRef(new byte[contents[i].length]);
         for (int j = 0; j < v.length; j++) {
           v.bytes[j] = (byte) contents[i][j];
         }
         doc.add(new KnnVectorField(field, v, EUCLIDEAN));
       } else {
         doc.add(new KnnVectorField(field, contents[i]));
       }
       doc.add(new StringField("id", "id" + i, Field.Store.YES));
       writer.addDocument(doc);
     }
     // Add some documents without a vector
     for (int i = 0; i < 5; i++) {
       Document doc = new Document();
       doc.add(new StringField("other", "value", Field.Store.NO));
       writer.addDocument(doc);
     }

     writer.close();
     return indexStore;
   }

   private void assertMatches(IndexSearcher searcher, Query q, int expectedMatches)
       throws IOException {
     ScoreDoc[] result = searcher.search(q, 1000).scoreDocs;
     assertEquals(expectedMatches, result.length);
   }

   private void assertIdMatches(IndexReader reader, String expectedId, ScoreDoc scoreDoc)
       throws IOException {
     String actualId = reader.document(scoreDoc.doc).get("id");
     assertEquals(expectedId, actualId);
   }

   /**
    * A version of {@link KnnVectorQuery} that throws an error when an exact search is run. This
    * allows us to check what search strategy is being used.
    */
   private static class ThrowingKnnVectorQuery extends KnnVectorQuery {

     public ThrowingKnnVectorQuery(String field, float[] target, int k, Query filter) {
       super(field, target, k, filter);
     }

     @Override
     protected TopDocs exactSearch(LeafReaderContext context, DocIdSetIterator acceptIterator) {
       throw new UnsupportedOperationException("exact search is not supported");
     }
   }

   private static class NoLiveDocsDirectoryReader extends FilterDirectoryReader {

     private NoLiveDocsDirectoryReader(DirectoryReader in) throws IOException {
       super(
           in,
           new SubReaderWrapper() {
             @Override
             public LeafReader wrap(LeafReader reader) {
               return new NoLiveDocsLeafReader(reader);
             }
           });
     }

     @Override
     protected DirectoryReader doWrapDirectoryReader(DirectoryReader in) throws IOException {
       return new NoLiveDocsDirectoryReader(in);
     }

     @Override
     public CacheHelper getReaderCacheHelper() {
       return in.getReaderCacheHelper();
     }
   }

   private static class NoLiveDocsLeafReader extends FilterLeafReader {
     private NoLiveDocsLeafReader(LeafReader in) {
       super(in);
     }

     @Override
     public int numDocs() {
       return 0;
     }

     @Override
     public Bits getLiveDocs() {
       return new Bits.MatchNoBits(in.maxDoc());
     }

     @Override
     public CacheHelper getReaderCacheHelper() {
       return in.getReaderCacheHelper();
     }

     @Override
     public CacheHelper getCoreCacheHelper() {
       return in.getCoreCacheHelper();
     }
   }

   private static class ThrowingBitSetQuery extends Query {

     private final FixedBitSet docs;

     ThrowingBitSetQuery(FixedBitSet docs) {
       this.docs = docs;
     }

     @Override
     public Weight createWeight(IndexSearcher searcher, ScoreMode scoreMode, float boost)
         throws IOException {
       return new ConstantScoreWeight(this, boost) {
         @Override
         public Scorer scorer(LeafReaderContext context) throws IOException {
           BitSetIterator bitSetIterator =
               new BitSetIterator(docs, docs.approximateCardinality()) {
                 @Override
                 public BitSet getBitSet() {
                   throw new UnsupportedOperationException("reusing BitSet is not supported");
                 }
               };
           return new ConstantScoreScorer(this, score(), scoreMode, bitSetIterator);
         }

         @Override
         public boolean isCacheable(LeafReaderContext ctx) {
           return false;
         }
       };
     }

     @Override
     public void visit(QueryVisitor visitor) {}

     @Override
     public String toString(String field) {
       return "throwingBitSetQuery";
     }

     @Override
     public boolean equals(Object other) {
       return sameClassAs(other) && docs.equals(((ThrowingBitSetQuery) other).docs);
     }

     @Override
     public int hashCode() {
       return 31 * classHash() + docs.hashCode();
     }
   }

   private VectorEncoding randomVectorEncoding() {
     return VectorEncoding.values()[random().nextInt(VectorEncoding.values().length)];
   }
 }