lucene/src/test/org/apache/lucene/index/TestParallelReader.java - lucene-solr - Git at Google

 package org.apache.lucene.index;

 /**
  * Licensed to the Apache Software Foundation (ASF) under one or more
  * contributor license agreements.  See the NOTICE file distributed with
  * this work for additional information regarding copyright ownership.
  * The ASF licenses this file to You under the Apache License, Version 2.0
  * (the "License"); you may not use this file except in compliance with
  * the License.  You may obtain a copy of the License at
  *
  *     http://www.apache.org/licenses/LICENSE-2.0
  *
  * Unless required by applicable law or agreed to in writing, software
  * distributed under the License is distributed on an "AS IS" BASIS,
  * WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
  * See the License for the specific language governing permissions and
  * limitations under the License.
  */

 import java.io.IOException;
 import java.util.Arrays;
 import java.util.Collection;
 import java.util.Random;

 import org.apache.lucene.analysis.MockAnalyzer;
 import org.apache.lucene.document.Document;
 import org.apache.lucene.document.Field;
 import org.apache.lucene.document.MapFieldSelector;
 import org.apache.lucene.search.BooleanClause.Occur;
 import org.apache.lucene.search.*;
 import org.apache.lucene.store.Directory;
 import org.apache.lucene.util.LuceneTestCase;

 public class TestParallelReader extends LuceneTestCase {

   private IndexSearcher parallel;
   private IndexSearcher single;
   private Directory dir, dir1, dir2;

   @Override
   public void setUp() throws Exception {
     super.setUp();
     single = single(random);
     parallel = parallel(random);
   }

   @Override
   public void tearDown() throws Exception {
     single.getIndexReader().close();
     single.close();
     parallel.getIndexReader().close();
     parallel.close();
     dir.close();
     dir1.close();
     dir2.close();
     super.tearDown();
   }

   public void testQueries() throws Exception {
     queryTest(new TermQuery(new Term("f1", "v1")));
     queryTest(new TermQuery(new Term("f1", "v2")));
     queryTest(new TermQuery(new Term("f2", "v1")));
     queryTest(new TermQuery(new Term("f2", "v2")));
     queryTest(new TermQuery(new Term("f3", "v1")));
     queryTest(new TermQuery(new Term("f3", "v2")));
     queryTest(new TermQuery(new Term("f4", "v1")));
     queryTest(new TermQuery(new Term("f4", "v2")));

     BooleanQuery bq1 = new BooleanQuery();
     bq1.add(new TermQuery(new Term("f1", "v1")), Occur.MUST);
     bq1.add(new TermQuery(new Term("f4", "v1")), Occur.MUST);
     queryTest(bq1);
   }

   public void testFieldNames() throws Exception {
     Directory dir1 = getDir1(random);
     Directory dir2 = getDir2(random);
     ParallelReader pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     pr.add(IndexReader.open(dir2, false));
     Collection<String> fieldNames = pr.getFieldNames(IndexReader.FieldOption.ALL);
     assertEquals(4, fieldNames.size());
     assertTrue(fieldNames.contains("f1"));
     assertTrue(fieldNames.contains("f2"));
     assertTrue(fieldNames.contains("f3"));
     assertTrue(fieldNames.contains("f4"));
     pr.close();
     dir1.close();
     dir2.close();
   }

   public void testDocument() throws IOException {
     Directory dir1 = getDir1(random);
     Directory dir2 = getDir2(random);
     ParallelReader pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     pr.add(IndexReader.open(dir2, false));

     Document doc11 = pr.document(0, new MapFieldSelector("f1"));
     Document doc24 = pr.document(1, new MapFieldSelector(Arrays.asList("f4")));
     Document doc223 = pr.document(1, new MapFieldSelector("f2", "f3"));

     assertEquals(1, doc11.getFields().size());
     assertEquals(1, doc24.getFields().size());
     assertEquals(2, doc223.getFields().size());

     assertEquals("v1", doc11.get("f1"));
     assertEquals("v2", doc24.get("f4"));
     assertEquals("v2", doc223.get("f2"));
     assertEquals("v2", doc223.get("f3"));
     pr.close();
     dir1.close();
     dir2.close();
   }

   public void testIncompatibleIndexes() throws IOException {
     // two documents:
     Directory dir1 = getDir1(random);

     // one document only:
     Directory dir2 = newDirectory();
     IndexWriter w2 = new IndexWriter(dir2, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
     Document d3 = new Document();
     d3.add(newField("f3", "v1", Field.Store.YES, Field.Index.ANALYZED));
     w2.addDocument(d3);
     w2.close();

     ParallelReader pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     IndexReader ir = IndexReader.open(dir2, false);
     try {
       pr.add(ir);
       fail("didn't get exptected exception: indexes don't have same number of documents");
     } catch (IllegalArgumentException e) {
       // expected exception
     }
     pr.close();
     ir.close();
     dir1.close();
     dir2.close();
   }

   public void testIsCurrent() throws IOException {
     Directory dir1 = getDir1(random);
     Directory dir2 = getDir2(random);
     ParallelReader pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     pr.add(IndexReader.open(dir2, false));

     assertTrue(pr.isCurrent());
     IndexReader modifier = IndexReader.open(dir1, false);
     DefaultSimilarity sim = new DefaultSimilarity();
     modifier.setNorm(0, "f1", sim.encodeNormValue(100f));
     modifier.close();

     // one of the two IndexReaders which ParallelReader is using
     // is not current anymore
     assertFalse(pr.isCurrent());

     modifier = IndexReader.open(dir2, false);
     modifier.setNorm(0, "f3", sim.encodeNormValue(100f));
     modifier.close();

     // now both are not current anymore
     assertFalse(pr.isCurrent());
     pr.close();
     dir1.close();
     dir2.close();
   }

   public void testIsOptimized() throws IOException {
     Directory dir1 = getDir1(random);
     Directory dir2 = getDir2(random);

     // add another document to ensure that the indexes are not optimized
     IndexWriter modifier = new IndexWriter(
         dir1,
         newIndexWriterConfig(TEST_VERSION_CURRENT, new MockAnalyzer(random)).
             setMergePolicy(newLogMergePolicy(10))
     );
     Document d = new Document();
     d.add(newField("f1", "v1", Field.Store.YES, Field.Index.ANALYZED));
     modifier.addDocument(d);
     modifier.close();

     modifier = new IndexWriter(
         dir2,
         newIndexWriterConfig(TEST_VERSION_CURRENT, new MockAnalyzer(random)).
             setMergePolicy(newLogMergePolicy(10))
     );
     d = new Document();
     d.add(newField("f2", "v2", Field.Store.YES, Field.Index.ANALYZED));
     modifier.addDocument(d);
     modifier.close();


     ParallelReader pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     pr.add(IndexReader.open(dir2, false));
     assertFalse(pr.isOptimized());
     pr.close();

     modifier = new IndexWriter(dir1, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
     modifier.optimize();
     modifier.close();

     pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     pr.add(IndexReader.open(dir2, false));
     // just one of the two indexes are optimized
     assertFalse(pr.isOptimized());
     pr.close();


     modifier = new IndexWriter(dir2, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
     modifier.optimize();
     modifier.close();

     pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     pr.add(IndexReader.open(dir2, false));
     // now both indexes are optimized
     assertTrue(pr.isOptimized());
     pr.close();
     dir1.close();
     dir2.close();
   }

   private void queryTest(Query query) throws IOException {
     ScoreDoc[] parallelHits = parallel.search(query, null, 1000).scoreDocs;
     ScoreDoc[] singleHits = single.search(query, null, 1000).scoreDocs;
     assertEquals(parallelHits.length, singleHits.length);
     for(int i = 0; i < parallelHits.length; i++) {
       assertEquals(parallelHits[i].score, singleHits[i].score, 0.001f);
       Document docParallel = parallel.doc(parallelHits[i].doc);
       Document docSingle = single.doc(singleHits[i].doc);
       assertEquals(docParallel.get("f1"), docSingle.get("f1"));
       assertEquals(docParallel.get("f2"), docSingle.get("f2"));
       assertEquals(docParallel.get("f3"), docSingle.get("f3"));
       assertEquals(docParallel.get("f4"), docSingle.get("f4"));
     }
   }

   // Fields 1-4 indexed together:
   private IndexSearcher single(Random random) throws IOException {
     dir = newDirectory();
     IndexWriter w = new IndexWriter(dir, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
     Document d1 = new Document();
     d1.add(newField("f1", "v1", Field.Store.YES, Field.Index.ANALYZED));
     d1.add(newField("f2", "v1", Field.Store.YES, Field.Index.ANALYZED));
     d1.add(newField("f3", "v1", Field.Store.YES, Field.Index.ANALYZED));
     d1.add(newField("f4", "v1", Field.Store.YES, Field.Index.ANALYZED));
     w.addDocument(d1);
     Document d2 = new Document();
     d2.add(newField("f1", "v2", Field.Store.YES, Field.Index.ANALYZED));
     d2.add(newField("f2", "v2", Field.Store.YES, Field.Index.ANALYZED));
     d2.add(newField("f3", "v2", Field.Store.YES, Field.Index.ANALYZED));
     d2.add(newField("f4", "v2", Field.Store.YES, Field.Index.ANALYZED));
     w.addDocument(d2);
     w.close();

     return new IndexSearcher(dir, false);
   }

   // Fields 1 & 2 in one index, 3 & 4 in other, with ParallelReader:
   private IndexSearcher parallel(Random random) throws IOException {
     dir1 = getDir1(random);
     dir2 = getDir2(random);
     ParallelReader pr = new ParallelReader();
     pr.add(IndexReader.open(dir1, false));
     pr.add(IndexReader.open(dir2, false));
     return newSearcher(pr);
   }

   private Directory getDir1(Random random) throws IOException {
     Directory dir1 = newDirectory();
     IndexWriter w1 = new IndexWriter(dir1, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
     Document d1 = new Document();
     d1.add(newField("f1", "v1", Field.Store.YES, Field.Index.ANALYZED));
     d1.add(newField("f2", "v1", Field.Store.YES, Field.Index.ANALYZED));
     w1.addDocument(d1);
     Document d2 = new Document();
     d2.add(newField("f1", "v2", Field.Store.YES, Field.Index.ANALYZED));
     d2.add(newField("f2", "v2", Field.Store.YES, Field.Index.ANALYZED));
     w1.addDocument(d2);
     w1.close();
     return dir1;
   }

   private Directory getDir2(Random random) throws IOException {
     Directory dir2 = newDirectory();
     IndexWriter w2 = new IndexWriter(dir2, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
     Document d3 = new Document();
     d3.add(newField("f3", "v1", Field.Store.YES, Field.Index.ANALYZED));
     d3.add(newField("f4", "v1", Field.Store.YES, Field.Index.ANALYZED));
     w2.addDocument(d3);
     Document d4 = new Document();
     d4.add(newField("f3", "v2", Field.Store.YES, Field.Index.ANALYZED));
     d4.add(newField("f4", "v2", Field.Store.YES, Field.Index.ANALYZED));
     w2.addDocument(d4);
     w2.close();
     return dir2;
   }

 }
	package org.apache.lucene.index;

	/**
	* Licensed to the Apache Software Foundation (ASF) under one or more
	* contributor license agreements. See the NOTICE file distributed with
	* this work for additional information regarding copyright ownership.
	* The ASF licenses this file to You under the Apache License, Version 2.0
	* (the "License"); you may not use this file except in compliance with
	* the License. You may obtain a copy of the License at
	*
	* http://www.apache.org/licenses/LICENSE-2.0
	*
	* Unless required by applicable law or agreed to in writing, software
	* distributed under the License is distributed on an "AS IS" BASIS,
	* WITHOUT WARRANTIES OR CONDITIONS OF ANY KIND, either express or implied.
	* See the License for the specific language governing permissions and
	* limitations under the License.
	*/

	import java.io.IOException;
	import java.util.Arrays;
	import java.util.Collection;
	import java.util.Random;

	import org.apache.lucene.analysis.MockAnalyzer;
	import org.apache.lucene.document.Document;
	import org.apache.lucene.document.Field;
	import org.apache.lucene.document.MapFieldSelector;
	import org.apache.lucene.search.BooleanClause.Occur;
	import org.apache.lucene.search.*;
	import org.apache.lucene.store.Directory;
	import org.apache.lucene.util.LuceneTestCase;

	public class TestParallelReader extends LuceneTestCase {

	private IndexSearcher parallel;
	private IndexSearcher single;
	private Directory dir, dir1, dir2;

	@Override
	public void setUp() throws Exception {
	super.setUp();
	single = single(random);
	parallel = parallel(random);
	}

	@Override
	public void tearDown() throws Exception {
	single.getIndexReader().close();
	single.close();
	parallel.getIndexReader().close();
	parallel.close();
	dir.close();
	dir1.close();
	dir2.close();
	super.tearDown();
	}

	public void testQueries() throws Exception {
	queryTest(new TermQuery(new Term("f1", "v1")));
	queryTest(new TermQuery(new Term("f1", "v2")));
	queryTest(new TermQuery(new Term("f2", "v1")));
	queryTest(new TermQuery(new Term("f2", "v2")));
	queryTest(new TermQuery(new Term("f3", "v1")));
	queryTest(new TermQuery(new Term("f3", "v2")));
	queryTest(new TermQuery(new Term("f4", "v1")));
	queryTest(new TermQuery(new Term("f4", "v2")));

	BooleanQuery bq1 = new BooleanQuery();
	bq1.add(new TermQuery(new Term("f1", "v1")), Occur.MUST);
	bq1.add(new TermQuery(new Term("f4", "v1")), Occur.MUST);
	queryTest(bq1);
	}

	public void testFieldNames() throws Exception {
	Directory dir1 = getDir1(random);
	Directory dir2 = getDir2(random);
	ParallelReader pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	pr.add(IndexReader.open(dir2, false));
	Collection<String> fieldNames = pr.getFieldNames(IndexReader.FieldOption.ALL);
	assertEquals(4, fieldNames.size());
	assertTrue(fieldNames.contains("f1"));
	assertTrue(fieldNames.contains("f2"));
	assertTrue(fieldNames.contains("f3"));
	assertTrue(fieldNames.contains("f4"));
	pr.close();
	dir1.close();
	dir2.close();
	}

	public void testDocument() throws IOException {
	Directory dir1 = getDir1(random);
	Directory dir2 = getDir2(random);
	ParallelReader pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	pr.add(IndexReader.open(dir2, false));

	Document doc11 = pr.document(0, new MapFieldSelector("f1"));
	Document doc24 = pr.document(1, new MapFieldSelector(Arrays.asList("f4")));
	Document doc223 = pr.document(1, new MapFieldSelector("f2", "f3"));

	assertEquals(1, doc11.getFields().size());
	assertEquals(1, doc24.getFields().size());
	assertEquals(2, doc223.getFields().size());

	assertEquals("v1", doc11.get("f1"));
	assertEquals("v2", doc24.get("f4"));
	assertEquals("v2", doc223.get("f2"));
	assertEquals("v2", doc223.get("f3"));
	pr.close();
	dir1.close();
	dir2.close();
	}

	public void testIncompatibleIndexes() throws IOException {
	// two documents:
	Directory dir1 = getDir1(random);

	// one document only:
	Directory dir2 = newDirectory();
	IndexWriter w2 = new IndexWriter(dir2, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
	Document d3 = new Document();
	d3.add(newField("f3", "v1", Field.Store.YES, Field.Index.ANALYZED));
	w2.addDocument(d3);
	w2.close();

	ParallelReader pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	IndexReader ir = IndexReader.open(dir2, false);
	try {
	pr.add(ir);
	fail("didn't get exptected exception: indexes don't have same number of documents");
	} catch (IllegalArgumentException e) {
	// expected exception
	}
	pr.close();
	ir.close();
	dir1.close();
	dir2.close();
	}

	public void testIsCurrent() throws IOException {
	Directory dir1 = getDir1(random);
	Directory dir2 = getDir2(random);
	ParallelReader pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	pr.add(IndexReader.open(dir2, false));

	assertTrue(pr.isCurrent());
	IndexReader modifier = IndexReader.open(dir1, false);
	DefaultSimilarity sim = new DefaultSimilarity();
	modifier.setNorm(0, "f1", sim.encodeNormValue(100f));
	modifier.close();

	// one of the two IndexReaders which ParallelReader is using
	// is not current anymore
	assertFalse(pr.isCurrent());

	modifier = IndexReader.open(dir2, false);
	modifier.setNorm(0, "f3", sim.encodeNormValue(100f));
	modifier.close();

	// now both are not current anymore
	assertFalse(pr.isCurrent());
	pr.close();
	dir1.close();
	dir2.close();
	}

	public void testIsOptimized() throws IOException {
	Directory dir1 = getDir1(random);
	Directory dir2 = getDir2(random);

	// add another document to ensure that the indexes are not optimized
	IndexWriter modifier = new IndexWriter(
	dir1,
	newIndexWriterConfig(TEST_VERSION_CURRENT, new MockAnalyzer(random)).
	setMergePolicy(newLogMergePolicy(10))
	);
	Document d = new Document();
	d.add(newField("f1", "v1", Field.Store.YES, Field.Index.ANALYZED));
	modifier.addDocument(d);
	modifier.close();

	modifier = new IndexWriter(
	dir2,
	newIndexWriterConfig(TEST_VERSION_CURRENT, new MockAnalyzer(random)).
	setMergePolicy(newLogMergePolicy(10))
	);
	d = new Document();
	d.add(newField("f2", "v2", Field.Store.YES, Field.Index.ANALYZED));
	modifier.addDocument(d);
	modifier.close();


	ParallelReader pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	pr.add(IndexReader.open(dir2, false));
	assertFalse(pr.isOptimized());
	pr.close();

	modifier = new IndexWriter(dir1, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
	modifier.optimize();
	modifier.close();

	pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	pr.add(IndexReader.open(dir2, false));
	// just one of the two indexes are optimized
	assertFalse(pr.isOptimized());
	pr.close();


	modifier = new IndexWriter(dir2, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
	modifier.optimize();
	modifier.close();

	pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	pr.add(IndexReader.open(dir2, false));
	// now both indexes are optimized
	assertTrue(pr.isOptimized());
	pr.close();
	dir1.close();
	dir2.close();
	}

	private void queryTest(Query query) throws IOException {
	ScoreDoc[] parallelHits = parallel.search(query, null, 1000).scoreDocs;
	ScoreDoc[] singleHits = single.search(query, null, 1000).scoreDocs;
	assertEquals(parallelHits.length, singleHits.length);
	for(int i = 0; i < parallelHits.length; i++) {
	assertEquals(parallelHits[i].score, singleHits[i].score, 0.001f);
	Document docParallel = parallel.doc(parallelHits[i].doc);
	Document docSingle = single.doc(singleHits[i].doc);
	assertEquals(docParallel.get("f1"), docSingle.get("f1"));
	assertEquals(docParallel.get("f2"), docSingle.get("f2"));
	assertEquals(docParallel.get("f3"), docSingle.get("f3"));
	assertEquals(docParallel.get("f4"), docSingle.get("f4"));
	}
	}

	// Fields 1-4 indexed together:
	private IndexSearcher single(Random random) throws IOException {
	dir = newDirectory();
	IndexWriter w = new IndexWriter(dir, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
	Document d1 = new Document();
	d1.add(newField("f1", "v1", Field.Store.YES, Field.Index.ANALYZED));
	d1.add(newField("f2", "v1", Field.Store.YES, Field.Index.ANALYZED));
	d1.add(newField("f3", "v1", Field.Store.YES, Field.Index.ANALYZED));
	d1.add(newField("f4", "v1", Field.Store.YES, Field.Index.ANALYZED));
	w.addDocument(d1);
	Document d2 = new Document();
	d2.add(newField("f1", "v2", Field.Store.YES, Field.Index.ANALYZED));
	d2.add(newField("f2", "v2", Field.Store.YES, Field.Index.ANALYZED));
	d2.add(newField("f3", "v2", Field.Store.YES, Field.Index.ANALYZED));
	d2.add(newField("f4", "v2", Field.Store.YES, Field.Index.ANALYZED));
	w.addDocument(d2);
	w.close();

	return new IndexSearcher(dir, false);
	}

	// Fields 1 & 2 in one index, 3 & 4 in other, with ParallelReader:
	private IndexSearcher parallel(Random random) throws IOException {
	dir1 = getDir1(random);
	dir2 = getDir2(random);
	ParallelReader pr = new ParallelReader();
	pr.add(IndexReader.open(dir1, false));
	pr.add(IndexReader.open(dir2, false));
	return newSearcher(pr);
	}

	private Directory getDir1(Random random) throws IOException {
	Directory dir1 = newDirectory();
	IndexWriter w1 = new IndexWriter(dir1, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
	Document d1 = new Document();
	d1.add(newField("f1", "v1", Field.Store.YES, Field.Index.ANALYZED));
	d1.add(newField("f2", "v1", Field.Store.YES, Field.Index.ANALYZED));
	w1.addDocument(d1);
	Document d2 = new Document();
	d2.add(newField("f1", "v2", Field.Store.YES, Field.Index.ANALYZED));
	d2.add(newField("f2", "v2", Field.Store.YES, Field.Index.ANALYZED));
	w1.addDocument(d2);
	w1.close();
	return dir1;
	}

	private Directory getDir2(Random random) throws IOException {
	Directory dir2 = newDirectory();
	IndexWriter w2 = new IndexWriter(dir2, newIndexWriterConfig( TEST_VERSION_CURRENT, new MockAnalyzer(random)));
	Document d3 = new Document();
	d3.add(newField("f3", "v1", Field.Store.YES, Field.Index.ANALYZED));
	d3.add(newField("f4", "v1", Field.Store.YES, Field.Index.ANALYZED));
	w2.addDocument(d3);
	Document d4 = new Document();
	d4.add(newField("f3", "v2", Field.Store.YES, Field.Index.ANALYZED));
	d4.add(newField("f4", "v2", Field.Store.YES, Field.Index.ANALYZED));
	w2.addDocument(d4);
	w2.close();
	return dir2;
	}

	}