upgrade_tests/paging_test.py - cassandra-dtest - Git at Google

 import itertools
 import time
 import uuid
 import pytest
 import logging

 from cassandra import ConsistencyLevel as CL
 from cassandra import InvalidRequest
 from cassandra.query import SimpleStatement, dict_factory, named_tuple_factory
 from ccmlib.common import LogPatternToVersion

 from dtest import run_scenarios, MAJOR_VERSION_4

 from tools.assertions import (assert_read_timeout_or_failure, assert_lists_equal_ignoring_order)
 from tools.data import rows_to_list
 from tools.datahelp import create_rows, flatten_into_set, parse_data_into_dicts
 from tools.misc import add_skip
 from tools.paging import PageAssertionMixin, PageFetcher
 from .upgrade_base import UpgradeTester
 from .upgrade_manifest import build_upgrade_pairs, RUN_STATIC_UPGRADE_MATRIX


 since = pytest.mark.since
 logger = logging.getLogger(__name__)


 class BasePagingTester(UpgradeTester):

     def prepare(self, *args, **kwargs):
         start_on, upgrade_to = self.UPGRADE_PATH.starting_meta, self.UPGRADE_PATH.upgrade_meta
         if 'protocol_version' not in list(kwargs.keys()):
             # Due to CASSANDRA-10880, we need to use proto v3 (instead of v4) when it's a mixed cluster of 2.2.x and 3.0.x nodes.
             if start_on.family in ('2.1.x', '2.2.x') and upgrade_to.family == '3.0.x':
                 logger.debug("Protocol version set to v3, due to 2.1.x/2.2.x and 3.0.x mixed version cluster.")
                 kwargs['protocol_version'] = 3

         cursor = UpgradeTester.prepare(self, *args, row_factory=kwargs.pop('row_factory', dict_factory), **kwargs)
         return cursor


 class TestPagingSize(BasePagingTester, PageAssertionMixin):
     """
     Basic tests relating to page size (relative to results set)
     and validation of page size setting.
     """

     def test_with_no_results(self):
         """
         No errors when a page is requested and query has no results.
         """
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int PRIMARY KEY, value text )")

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))

             # run a query that has no results and make sure it's exhausted
             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test", fetch_size=100, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future)
             pf.request_all()
             assert [] == pf.all_data()
             assert not pf.has_more_pages

     def test_with_less_results_than_page_size(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int PRIMARY KEY, value text )")

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                 |id| value          |
                 |1 |testing         |
                 |2 |and more testing|
                 |3 |and more testing|
                 |4 |and more testing|
                 |5 |and more testing|
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': str})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test", fetch_size=100, consistency_level=CL.ALL)
             )
             pf = PageFetcher(future)
             pf.request_all()

             assert not pf.has_more_pages
             assert len(expected_data) == len(pf.all_data())

     def test_with_more_results_than_page_size(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int PRIMARY KEY, value text )")

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                 |id| value          |
                 |1 |testing         |
                 |2 |and more testing|
                 |3 |and more testing|
                 |4 |and more testing|
                 |5 |and more testing|
                 |6 |testing         |
                 |7 |and more testing|
                 |8 |and more testing|
                 |9 |and more testing|
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': str})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test", fetch_size=5, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.pagecount() == 2
             assert pf.num_results_all() == [5, 4]

             # make sure expected and actual have same data elements (ignoring order)
             assert_lists_equal_ignoring_order(pf.all_data(), expected_data, sort_key='value')

     def test_with_equal_results_to_page_size(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int PRIMARY KEY, value text )")

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                 |id| value          |
                 |1 |testing         |
                 |2 |and more testing|
                 |3 |and more testing|
                 |4 |and more testing|
                 |5 |and more testing|
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': str})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test", fetch_size=5, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.num_results_all() == [5]
             assert pf.pagecount() == 1

             # make sure expected and actual have same data elements (ignoring order)
             assert_lists_equal_ignoring_order(pf.all_data(), expected_data, sort_key='value')

     def test_undefined_page_size_default(self):
         """
         If the page size isn't sent then the default fetch size is used.
         """
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id uuid PRIMARY KEY, value text )")

         def random_txt(text):
             return uuid.uuid4()

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                    | id     |value   |
               *5001| [uuid] |testing |
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': random_txt, 'value': str})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test", consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.num_results_all(), [5000 == 1]

             self.maxDiff = None
             # make sure expected and actual have same data elements (ignoring order)
             assert_lists_equal_ignoring_order(pf.all_data(), expected_data, sort_key='value')


 class TestPagingWithModifiers(BasePagingTester, PageAssertionMixin):
     """
     Tests concerned with paging when CQL modifiers (such as order, limit, allow filtering) are used.
     """

     def test_with_order_by(self):
         """"
         Paging over a single partition with ordering should work.
         (Spanning multiple partitions won't though, by design. See CASSANDRA-6722).
         """
         cursor = self.prepare()
         cursor.execute(
             """
             CREATE TABLE paging_test (
                 id int,
                 value text,
                 PRIMARY KEY (id, value)
             ) WITH CLUSTERING ORDER BY (value ASC)
             """)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                 |id|value|
                 |1 |a    |
                 |1 |b    |
                 |1 |c    |
                 |1 |d    |
                 |1 |e    |
                 |1 |f    |
                 |1 |g    |
                 |1 |h    |
                 |1 |i    |
                 |1 |j    |
                 """

             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': str})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id = 1 order by value asc", fetch_size=5, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.pagecount() == 2
             assert pf.num_results_all() == [5, 5]

             # these should be equal (in the same order)
             assert pf.all_data() == expected_data

             # make sure we don't allow paging over multiple partitions with order because that's weird
             with pytest.raises(InvalidRequest, match='Cannot page queries with both ORDER BY and a IN restriction on the partition key'):
                 stmt = SimpleStatement("select * from paging_test where id in (1,2) order by value asc", consistency_level=CL.ALL)
                 cursor.execute(stmt)

     def test_with_order_by_reversed(self):
         """"
         Paging over a single partition with ordering and a reversed clustering order.
         """
         cursor = self.prepare()
         cursor.execute(
             """
             CREATE TABLE paging_test (
                 id int,
                 value text,
                 value2 text,
                 value3 text,
                 PRIMARY KEY (id, value)
             ) WITH CLUSTERING ORDER BY (value DESC)
             """)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                 |id|value|value2|value3|
                 |1 |a    |a     |a     |
                 |1 |b    |b     |b     |
                 |1 |c    |c     |c     |
                 |1 |d    |d     |d     |
                 |1 |e    |e     |e     |
                 |1 |f    |f     |f     |
                 |1 |g    |g     |g     |
                 |1 |h    |h     |h     |
                 |1 |i    |i     |i     |
                 |1 |j    |j     |j     |
                 """

             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': str, 'value2': str})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id = 1 order by value asc", fetch_size=3, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             print("pages:", pf.num_results_all())
             assert pf.pagecount() == 4
             assert pf.num_results_all(), [3, 3, 3 == 1]

             # these should be equal (in the same order)
             assert pf.all_data() == expected_data

             # drop the ORDER BY
             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id = 1", fetch_size=3, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.pagecount() == 4
             assert pf.num_results_all(), [3, 3, 3 == 1]

             # these should be equal (in the same order)
             assert pf.all_data() == list(reversed(expected_data))

     def test_with_limit(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, value text, PRIMARY KEY (id, value) )")

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                    | id | value         |
                  *5| 1  | [random text] |
                  *5| 2  | [random text] |
                 *10| 3  | [random text] |
                 *10| 4  | [random text] |
                 *20| 5  | [random text] |
                 *30| 6  | [random text] |
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': random_txt})

             scenarios = [
                 # using equals clause w/single partition
                 {'limit': 10, 'fetch': 20, 'data_size': 30, 'whereclause': 'WHERE id = 6', 'expect_pgcount': 1, 'expect_pgsizes': [10]},      # limit < fetch < data
                 {'limit': 10, 'fetch': 30, 'data_size': 20, 'whereclause': 'WHERE id = 5', 'expect_pgcount': 1, 'expect_pgsizes': [10]},      # limit < data < fetch
                 {'limit': 20, 'fetch': 10, 'data_size': 30, 'whereclause': 'WHERE id = 6', 'expect_pgcount': 2, 'expect_pgsizes': [10, 10]},  # fetch < limit < data
                 {'limit': 30, 'fetch': 10, 'data_size': 20, 'whereclause': 'WHERE id = 5', 'expect_pgcount': 2, 'expect_pgsizes': [10, 10]},  # fetch < data < limit
                 {'limit': 20, 'fetch': 30, 'data_size': 10, 'whereclause': 'WHERE id = 3', 'expect_pgcount': 1, 'expect_pgsizes': [10]},      # data < limit < fetch
                 {'limit': 30, 'fetch': 20, 'data_size': 10, 'whereclause': 'WHERE id = 3', 'expect_pgcount': 1, 'expect_pgsizes': [10]},      # data < fetch < limit

                 # using 'in' clause w/multi partitions
                 {'limit': 9, 'fetch': 20, 'data_size': 80, 'whereclause': 'WHERE id in (1,2,3,4,5,6)', 'expect_pgcount': 1, 'expect_pgsizes': [9]},  # limit < fetch < data
                 {'limit': 10, 'fetch': 30, 'data_size': 20, 'whereclause': 'WHERE id in (3,4)', 'expect_pgcount': 1, 'expect_pgsizes': [10]},      # limit < data < fetch
                 {'limit': 20, 'fetch': 10, 'data_size': 30, 'whereclause': 'WHERE id in (4,5)', 'expect_pgcount': 2, 'expect_pgsizes': [10, 10]},  # fetch < limit < data
                 {'limit': 30, 'fetch': 10, 'data_size': 20, 'whereclause': 'WHERE id in (3,4)', 'expect_pgcount': 2, 'expect_pgsizes': [10, 10]},  # fetch < data < limit
                 {'limit': 20, 'fetch': 30, 'data_size': 10, 'whereclause': 'WHERE id in (1,2)', 'expect_pgcount': 1, 'expect_pgsizes': [10]},      # data < limit < fetch
                 {'limit': 30, 'fetch': 20, 'data_size': 10, 'whereclause': 'WHERE id in (1,2)', 'expect_pgcount': 1, 'expect_pgsizes': [10]},      # data < fetch < limit

                 # no limit but with a defined pagesize. Scenarios added for CASSANDRA-8408.
                 {'limit': None, 'fetch': 20, 'data_size': 80, 'whereclause': 'WHERE id in (1,2,3,4,5,6)', 'expect_pgcount': 4, 'expect_pgsizes': [20, 20, 20, 20]},  # fetch < data
                 {'limit': None, 'fetch': 30, 'data_size': 20, 'whereclause': 'WHERE id in (3,4)', 'expect_pgcount': 1, 'expect_pgsizes': [20]},          # data < fetch
                 {'limit': None, 'fetch': 10, 'data_size': 30, 'whereclause': 'WHERE id in (4,5)', 'expect_pgcount': 3, 'expect_pgsizes': [10, 10, 10]},  # fetch < data
                 {'limit': None, 'fetch': 30, 'data_size': 10, 'whereclause': 'WHERE id in (1,2)', 'expect_pgcount': 1, 'expect_pgsizes': [10]},          # data < fetch

                 # not setting fetch_size (unpaged) but using limit. Scenarios added for CASSANDRA-8408.
                 {'limit': 9, 'fetch': None, 'data_size': 80, 'whereclause': 'WHERE id in (1,2,3,4,5,6)', 'expect_pgcount': 1, 'expect_pgsizes': [9]},  # limit < data
                 {'limit': 30, 'fetch': None, 'data_size': 10, 'whereclause': 'WHERE id in (1,2)', 'expect_pgcount': 1, 'expect_pgsizes': [10]},        # data < limit
             ]

             def handle_scenario(scenario):
                 # using a limit and a fetch
                 if scenario['limit'] and scenario['fetch']:
                     future = cursor.execute_async(
                         SimpleStatement(
                             "select * from paging_test {} limit {}".format(scenario['whereclause'], scenario['limit']),
                             fetch_size=scenario['fetch'], consistency_level=CL.ALL)
                     )
                 # using a limit but not specifying a fetch_size
                 elif scenario['limit'] and scenario['fetch'] is None:
                     future = cursor.execute_async(
                         SimpleStatement(
                             "select * from paging_test {} limit {}".format(scenario['whereclause'], scenario['limit']),
                             consistency_level=CL.ALL)
                     )
                 # no limit but a fetch_size specified
                 elif scenario['limit'] is None and scenario['fetch']:
                     future = cursor.execute_async(
                         SimpleStatement(
                             "select * from paging_test {}".format(scenario['whereclause']),
                             fetch_size=scenario['fetch'], consistency_level=CL.ALL)
                     )
                 else:
                     # this should not happen
                     self.fail("Invalid configuration, this should never happen, please go into the code")

                 pf = PageFetcher(future).request_all()
                 assert pf.num_results_all() == scenario['expect_pgsizes']
                 assert pf.pagecount() == scenario['expect_pgcount']

                 # make sure all the data retrieved is a subset of input data
                 self.assertIsSubsetOf(pf.all_data(), expected_data)

             run_scenarios(scenarios, handle_scenario, deferred_exceptions=(AssertionError,))

     def test_with_allow_filtering(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, value text, PRIMARY KEY (id, value) )")

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                 |id|value           |
                 |1 |testing         |
                 |2 |and more testing|
                 |3 |and more testing|
                 |4 |and more testing|
                 |5 |and more testing|
                 |6 |testing         |
                 |7 |and more testing|
                 |8 |and more testing|
                 |9 |and more testing|
                 """
             create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': str})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where value = 'and more testing' ALLOW FILTERING", fetch_size=4, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.pagecount() == 2
             assert pf.num_results_all() == [4, 3]

             # make sure the allow filtering query matches the expected results (ignoring order)
             assert_lists_equal_ignoring_order(
                 pf.all_data(),
                 parse_data_into_dicts(
                     """
                     |id|value           |
                     |2 |and more testing|
                     |3 |and more testing|
                     |4 |and more testing|
                     |5 |and more testing|
                     |7 |and more testing|
                     |8 |and more testing|
                     |9 |and more testing|
                     """, format_funcs={'id': int, 'value': str}
                 ),
                 sort_key='value'
             )


 class TestPagingData(BasePagingTester, PageAssertionMixin):

     def test_basic_paging(self):
         """
         A simple paging test that is easy to debug.
         """
         cursor = self.prepare()

         cursor.execute("""
             CREATE TABLE test (
                 k int,
                 c int,
                 v text,
                 PRIMARY KEY (k, c)
             );
         """)

         testing_compact_storage = self.cluster.version() <= MAJOR_VERSION_4
         if testing_compact_storage:
             cursor.execute("""
                 CREATE TABLE test2 (
                     k int,
                     c int,
                     v text,
                     PRIMARY KEY (k, c)
                 ) WITH COMPACT STORAGE;
             """)

         for is_upgraded, cursor in self.do_upgrade(cursor):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE test")
             if testing_compact_storage:
                 cursor.execute("TRUNCATE test2")

             tables = ["test", "test2"] if testing_compact_storage else ["test"]
             for table in tables:
                 logger.debug("Querying table %s" % (table,))
                 expected = []
                 # match the key ordering for murmur3
                 for k in (1, 0, 2):
                     for c in range(5):
                         value = "%d.%d" % (k, c)
                         cursor.execute("INSERT INTO " + table + " (k, c, v) VALUES (%s, %s, %s)", (k, c, value))
                         expected.append([k, c, value])

                 for fetch_size in (2, 3, 5, 10, 100):
                     logger.debug("Using fetch size %d" % fetch_size)
                     cursor.default_fetch_size = fetch_size
                     results = rows_to_list(cursor.execute("SELECT * FROM %s" % (table,)))
                     import pprint
                     pprint.pprint(results)
                     assert len(expected) == len(results)
                     assert expected == results

     def test_basic_compound_paging(self):
         cursor = self.prepare()

         cursor.execute("""
             CREATE TABLE test (
                 k int,
                 c1 int,
                 c2 int,
                 v text,
                 PRIMARY KEY (k, c1, c2)
             );
         """)

         testing_compact_storage = self.cluster.version() <= MAJOR_VERSION_4
         if testing_compact_storage:
             cursor.execute("""
                 CREATE TABLE test2 (
                     k int,
                     c1 int,
                     c2 int,
                     v text,
                     PRIMARY KEY (k, c1, c2)
                 ) WITH COMPACT STORAGE;
             """)

         for is_upgraded, cursor in self.do_upgrade(cursor):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE test")
             if testing_compact_storage:
               cursor.execute("TRUNCATE test2")

             tables = ["test", "test2"] if testing_compact_storage else ["test"]
             for table in tables:
                 logger.debug("Querying table %s" % (table,))
                 expected = []
                 # match the key ordering for murmur3
                 for k in (1, 0, 2):
                     for c in range(5):
                         value = "%d.%d" % (k, c)
                         cursor.execute("INSERT INTO " + table + " (k, c1, c2, v) VALUES (%s, %s, 0, %s)", (k, c, value))
                         expected.append([k, c, 0, value])

                 for fetch_size in (2, 3, 5, 10, 100):
                     logger.debug("Using fetch size %d" % fetch_size)
                     cursor.default_fetch_size = fetch_size
                     results = rows_to_list(cursor.execute("SELECT * FROM %s" % (table,)))
                     import pprint
                     pprint.pprint(results)
                     assert len(expected) == len(results)
                     assert expected == results

     def test_paging_a_single_wide_row(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, value text, PRIMARY KEY (id, value) )")

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                   | id | value                  |
             *10000| 1  | [replaced with random] |
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': random_txt})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id = 1", fetch_size=3000, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.pagecount() == 4
             assert pf.num_results_all(), [3000, 3000, 3000 == 1000]

             all_results = pf.all_data()
             assert len(expected_data) == len(all_results)
             self.maxDiff = None
             assert_lists_equal_ignoring_order(expected_data, all_results, sort_key='value')

     def test_paging_across_multi_wide_rows(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, value text, PRIMARY KEY (id, value) )")

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                   | id | value                  |
              *5000| 1  | [replaced with random] |
              *5000| 2  | [replaced with random] |
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'value': random_txt})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id in (1,2)", fetch_size=3000, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             assert pf.pagecount() == 4
             assert pf.num_results_all(), [3000, 3000, 3000 == 1000]

             self.assertEqualIgnoreOrder(pf.all_data(), expected_data)

     def test_paging_using_secondary_indexes(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, mybool boolean, sometext text, PRIMARY KEY (id, sometext) )")
         cursor.execute("CREATE INDEX ON paging_test(mybool)")

         def random_txt(text):
             return str(uuid.uuid4())

         def bool_from_str_int(text):
             return bool(int(text))

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                  | id | mybool| sometext |
              *100| 1  | 1     | [random] |
              *300| 2  | 0     | [random] |
              *500| 3  | 1     | [random] |
              *400| 4  | 0     | [random] |
                 """
             all_data = create_rows(
                 data, cursor, 'paging_test', cl=CL.ALL,
                 format_funcs={'id': int, 'mybool': bool_from_str_int, 'sometext': random_txt}
             )

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where mybool = true", fetch_size=400, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             # the query only searched for True rows, so let's pare down the expectations for comparison
             expected_data = [x for x in all_data if x.get('mybool') is True]

             assert pf.pagecount() == 2
             assert pf.num_results_all() == [400, 200]
             assert_lists_equal_ignoring_order(expected_data, pf.all_data(), sort_key='sometext')

     @since('2.0.6')
     def test_static_columns_paging(self):
         """
         Exercises paging with static columns to detect bugs
         @jira_ticket CASSANDRA-8502.
         """
         cursor = self.prepare(row_factory=named_tuple_factory)
         cursor.execute("CREATE TABLE test (a int, b int, c int, s1 int static, s2 int static, PRIMARY KEY (a, b))")

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=named_tuple_factory):
             min_version = min(self.get_node_versions())
             latest_version_with_bug = '2.2.3'
             if min_version <= latest_version_with_bug:
                 pytest.skip('known bug released in {latest_ver} and earlier (current min version {min_ver}); '
                                'skipping'.format(latest_ver=latest_version_with_bug, min_ver=min_version))

             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE test")

             for i in range(4):
                 for j in range(4):
                     cursor.execute("INSERT INTO test (a, b, c, s1, s2) VALUES (%d, %d, %d, %d, %d)" % (i, j, j, 17, 42))

             selectors = (
                 "*",
                 "a, b, c, s1, s2",
                 "a, b, c, s1",
                 "a, b, c, s2",
                 "a, b, c")

             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test" % selector))
                     import pprint
                     pprint.pprint(results)
                     # assert 16 == len(results)
                     assert [0] * 4 + [1] * 4 + [2] * 4 + [3] * 4 == sorted([r.a for r in results])
                     assert [0, 1, 2, 3] * 4 == [r.b for r in results]
                     assert [0, 1, 2, 3] * 4 == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 16 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 16 == [r.s2 for r in results]

             # IN over the partitions
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a IN (0, 1, 2, 3)" % selector))
                     assert 16 == len(results)
                     assert [0] * 4 + [1] * 4 + [2] * 4 + [3] * 4 == sorted([r.a for r in results])
                     assert [0, 1, 2, 3] * 4 == [r.b for r in results]
                     assert [0, 1, 2, 3] * 4 == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 16 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 16 == [r.s2 for r in results]

             # single partition
             for i in range(16):
                 cursor.execute("INSERT INTO test (a, b, c, s1, s2) VALUES (%d, %d, %d, %d, %d)" % (99, i, i, 17, 42))

             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99" % selector))
                     assert 16 == len(results)
                     assert [99] * 16 == [r.a for r in results]
                     assert list(range(16)) == [r.b for r in results]
                     assert list(range(16)) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 16 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 16 == [r.s2 for r in results]

             # reversed
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 ORDER BY b DESC" % selector))
                     assert 16 == len(results)
                     assert [99] * 16 == [r.a for r in results]
                     assert list(reversed(list(range(16)))) == [r.b for r in results]
                     assert list(reversed(list(range(16)))) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 16 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 16 == [r.s2 for r in results]

             # IN on clustering column
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b IN (3, 4, 8, 14, 15)" % selector))
                     assert 5 == len(results)
                     assert [99] * 5 == [r.a for r in results]
                     assert [3, 4, 8, 14, 15] == [r.b for r in results]
                     assert [3, 4, 8, 14, 15] == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 5 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 5 == [r.s2 for r in results]

             # reversed IN on clustering column
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b IN (3, 4, 8, 14, 15) ORDER BY b DESC" % selector))
                     assert 5 == len(results)
                     assert [99] * 5 == [r.a for r in results]
                     assert list(reversed([3, 4, 8, 14, 15])) == [r.b for r in results]
                     assert list(reversed([3, 4, 8, 14, 15])) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 5 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 5 == [r.s2 for r in results]

             # slice on clustering column with set start
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b > 3" % selector))
                     assert 12 == len(results)
                     assert [99] * 12 == [r.a for r in results]
                     assert list(range(4, 16)) == [r.b for r in results]
                     assert list(range(4, 16)) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 12 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 12 == [r.s2 for r in results]

             # reversed slice on clustering column with set finish
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b > 3 ORDER BY b DESC" % selector))
                     assert 12 == len(results)
                     assert [99] * 12 == [r.a for r in results]
                     assert list(reversed(list(range(4, 16)))) == [r.b for r in results]
                     assert list(reversed(list(range(4, 16)))) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 12 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 12 == [r.s2 for r in results]

             # slice on clustering column with set finish
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b < 14" % selector))
                     assert 14 == len(results)
                     assert [99] * 14 == [r.a for r in results]
                     assert list(range(14)) == [r.b for r in results]
                     assert list(range(14)) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 14 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 14 == [r.s2 for r in results]

             # reversed slice on clustering column with set start
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b < 14 ORDER BY b DESC" % selector))
                     assert 14 == len(results)
                     assert [99] * 14 == [r.a for r in results]
                     assert list(reversed(list(range(14)))) == [r.b for r in results]
                     assert list(reversed(list(range(14)))) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 14 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 14 == [r.s2 for r in results]

             # slice on clustering column with start and finish
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b > 3 AND b < 14" % selector))
                     assert 10 == len(results)
                     assert [99] * 10 == [r.a for r in results]
                     assert list(range(4, 14)) == [r.b for r in results]
                     assert list(range(4, 14)) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 10 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 10 == [r.s2 for r in results]

             # reversed slice on clustering column with start and finish
             for page_size in (2, 3, 4, 5, 15, 16, 17, 100):
                 logger.debug("Using page size of %d" % page_size)
                 cursor.default_fetch_size = page_size
                 for selector in selectors:
                     logger.debug("Using selector '%s'" % (selector,))
                     results = list(cursor.execute("SELECT %s FROM test WHERE a = 99 AND b > 3 AND b < 14 ORDER BY b DESC" % selector))
                     assert 10 == len(results)
                     assert [99] * 10 == [r.a for r in results]
                     assert list(reversed(list(range(4, 14)))) == [r.b for r in results]
                     assert list(reversed(list(range(4, 14)))) == [r.c for r in results]
                     if "s1" in selector:
                         assert [17] * 10 == [r.s1 for r in results]
                     if "s2" in selector:
                         assert [42] * 10 == [r.s2 for r in results]

     @since('2.0')
     def test_paging_using_secondary_indexes_with_static_cols(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, s1 int static, s2 int static, mybool boolean, sometext text, PRIMARY KEY (id, sometext) )")
         cursor.execute("CREATE INDEX ON paging_test(mybool)")

         def random_txt(text):
             return str(uuid.uuid4())

         def bool_from_str_int(text):
             return bool(int(text))

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                  | id | s1 | s2 | mybool| sometext |
              *100| 1  | 1  | 4  | 1     | [random] |
              *300| 2  | 2  | 3  | 0     | [random] |
              *500| 3  | 3  | 2  | 1     | [random] |
              *400| 4  | 4  | 1  | 0     | [random] |
                 """
             all_data = create_rows(
                 data, cursor, 'paging_test', cl=CL.ALL,
                 format_funcs={'id': int, 'mybool': bool_from_str_int, 'sometext': random_txt, 's1': int, 's2': int}
             )

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where mybool = true", fetch_size=400, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future).request_all()

             # the query only searched for True rows, so let's pare down the expectations for comparison
             expected_data = [x for x in all_data if x.get('mybool') is True]

             assert pf.pagecount() == 2
             assert pf.num_results_all() == [400, 200]
             assert_lists_equal_ignoring_order(expected_data, pf.all_data(), sort_key='sometext')


 class TestPagingDatasetChanges(BasePagingTester, PageAssertionMixin):
     """
     Tests concerned with paging when the queried dataset changes while pages are being retrieved.
     """

     def test_data_change_impacting_earlier_page(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, mytext text, PRIMARY KEY (id, mytext) )")

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                   | id | mytext   |
               *500| 1  | [random] |
               *500| 2  | [random] |
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'mytext': random_txt})

             # get 501 rows so we have definitely got the 1st row of the second partition
             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id in (1,2)", fetch_size=501, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future)
             # no need to request page here, because the first page is automatically retrieved

             # we got one page and should be done with the first partition (for id=1)
             # let's add another row for that first partition (id=1) and make sure it won't sneak into results
             cursor.execute(SimpleStatement("insert into paging_test (id, mytext) values (1, 'foo')", consistency_level=CL.ALL))

             pf.request_all()
             assert pf.pagecount() == 2
             assert pf.num_results_all(), [501 == 499]

             assert_lists_equal_ignoring_order(pf.all_data(), expected_data, sort_key='mytext')

     def test_data_change_impacting_later_page(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, mytext text, PRIMARY KEY (id, mytext) )")

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                   | id | mytext   |
               *500| 1  | [random] |
               *499| 2  | [random] |
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'mytext': random_txt})

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id in (1,2)", fetch_size=500, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future)
             # no need to request page here, because the first page is automatically retrieved

             # we've already paged the first partition, but adding a row for the second (id=2)
             # should still result in the row being seen on the subsequent pages
             cursor.execute(SimpleStatement("insert into paging_test (id, mytext) values (2, 'foo')", consistency_level=CL.ALL))

             pf.request_all()
             assert pf.pagecount() == 2
             assert pf.num_results_all(), [500 == 500]

             # add the new row to the expected data and then do a compare
             expected_data.append({'id': 2, 'mytext': 'foo'})
             assert_lists_equal_ignoring_order(pf.all_data(), expected_data, sort_key='mytext')

     def test_row_TTL_expiry_during_paging(self):
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, mytext text, PRIMARY KEY (id, mytext) )")

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             # create rows with TTL (some of which we'll try to get after expiry)
             create_rows(
                 """
                     | id | mytext   |
                 *300| 1  | [random] |
                 *400| 2  | [random] |
                 """,
                 cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'mytext': random_txt}, postfix='USING TTL 10'
             )

             # create rows without TTL
             create_rows(
                 """
                     | id | mytext   |
                 *500| 3  | [random] |
                 """,
                 cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'mytext': random_txt}
             )

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id in (1,2,3)", fetch_size=300, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future)
             # no need to request page here, because the first page is automatically retrieved
             # this page will be partition id=1, it has TTL rows but they are not expired yet

             # sleep so that the remaining TTL rows from partition id=2 expire
             time.sleep(15)

             pf.request_all()
             assert pf.pagecount() == 3
             assert pf.num_results_all() == [300, 300, 200]

     def test_cell_TTL_expiry_during_paging(self):
         cursor = self.prepare()
         cursor.execute("""
             CREATE TABLE paging_test (
                 id int,
                 mytext text,
                 somevalue text,
                 anothervalue text,
                 PRIMARY KEY (id, mytext) )
             """)

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = create_rows(
                 """
                     | id | mytext   | somevalue | anothervalue |
                 *500| 1  | [random] | foo       |  bar         |
                 *500| 2  | [random] | foo       |  bar         |
                 *500| 3  | [random] | foo       |  bar         |
                 """,
                 cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'mytext': random_txt}
             )

             future = cursor.execute_async(
                 SimpleStatement("select * from paging_test where id in (1,2,3)", fetch_size=500, consistency_level=CL.ALL)
             )

             pf = PageFetcher(future)

             # no need to request page here, because the first page is automatically retrieved
             page1 = pf.page_data(1)
             assert_lists_equal_ignoring_order(page1, data[:500], sort_key="mytext")

             # set some TTLs for data on page 3
             for row in data[1000:1500]:
                 _id, mytext = row['id'], row['mytext']
                 stmt = SimpleStatement("""
                     update paging_test using TTL 10
                     set somevalue='one', anothervalue='two' where id = {id} and mytext = '{mytext}'
                     """.format(id=_id, mytext=mytext),
                     consistency_level=CL.ALL
                 )
                 cursor.execute(stmt)

             # check page two
             pf.request_one()
             page2 = pf.page_data(2)
             assert_lists_equal_ignoring_order(page2, data[500:1000], sort_key="mytext")

             page3expected = []
             for row in data[1000:1500]:
                 _id, mytext = row['id'], row['mytext']
                 page3expected.append(
                     {'id': _id, 'mytext': mytext, 'somevalue': None, 'anothervalue': None}
                 )

             time.sleep(15)

             pf.request_one()
             page3 = pf.page_data(3)
             assert_lists_equal_ignoring_order(page3, page3expected, sort_key="mytext")


 class TestPagingQueryIsolation(BasePagingTester, PageAssertionMixin):
     """
     Tests concerned with isolation of paged queries (queries can't affect each other).
     """

     def test_query_isolation(self):
         """
         Interleave some paged queries and make sure nothing bad happens.
         """
         cursor = self.prepare()
         cursor.execute("CREATE TABLE paging_test ( id int, mytext text, PRIMARY KEY (id, mytext) )")

         def random_txt(text):
             return str(uuid.uuid4())

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             data = """
                    | id | mytext   |
               *5000| 1  | [random] |
               *5000| 2  | [random] |
               *5000| 3  | [random] |
               *5000| 4  | [random] |
               *5000| 5  | [random] |
               *5000| 6  | [random] |
               *5000| 7  | [random] |
               *5000| 8  | [random] |
               *5000| 9  | [random] |
               *5000| 10 | [random] |
                 """
             expected_data = create_rows(data, cursor, 'paging_test', cl=CL.ALL, format_funcs={'id': int, 'mytext': random_txt})

             stmts = [
                 SimpleStatement("select * from paging_test where id in (1)", fetch_size=500, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (2)", fetch_size=600, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (3)", fetch_size=700, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (4)", fetch_size=800, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (5)", fetch_size=900, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (1)", fetch_size=1000, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (2)", fetch_size=1100, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (3)", fetch_size=1200, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (4)", fetch_size=1300, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (5)", fetch_size=1400, consistency_level=CL.ALL),
                 SimpleStatement("select * from paging_test where id in (1,2,3,4,5,6,7,8,9,10)", fetch_size=1500, consistency_level=CL.ALL)
             ]

             page_fetchers = []

             for stmt in stmts:
                 future = cursor.execute_async(stmt)
                 page_fetchers.append(PageFetcher(future))
                 # first page is auto-retrieved, so no need to request it

             for pf in page_fetchers:
                 pf.request_one(timeout=10)

             for pf in page_fetchers:
                 pf.request_one(timeout=10)

             for pf in page_fetchers:
                 pf.request_all(timeout=10)

             assert page_fetchers[0].pagecount() == 10
             assert page_fetchers[1].pagecount() == 9
             assert page_fetchers[2].pagecount() == 8
             assert page_fetchers[3].pagecount() == 7
             assert page_fetchers[4].pagecount() == 6
             assert page_fetchers[5].pagecount() == 5
             assert page_fetchers[6].pagecount() == 5
             assert page_fetchers[7].pagecount() == 5
             assert page_fetchers[8].pagecount() == 4
             assert page_fetchers[9].pagecount() == 4
             assert page_fetchers[10].pagecount() == 34

             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[0].all_data()), flatten_into_set(expected_data[:5000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[1].all_data()), flatten_into_set(expected_data[5000:10000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[2].all_data()), flatten_into_set(expected_data[10000:15000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[3].all_data()), flatten_into_set(expected_data[15000:20000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[4].all_data()), flatten_into_set(expected_data[20000:25000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[5].all_data()), flatten_into_set(expected_data[:5000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[6].all_data()), flatten_into_set(expected_data[5000:10000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[7].all_data()), flatten_into_set(expected_data[10000:15000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[8].all_data()), flatten_into_set(expected_data[15000:20000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[9].all_data()), flatten_into_set(expected_data[20000:25000]))
             self.assertEqualIgnoreOrder(flatten_into_set(page_fetchers[10].all_data()), flatten_into_set(expected_data[:50000]))


 class TestPagingWithDeletions(BasePagingTester, PageAssertionMixin):
     """
     Tests concerned with paging when deletions occur.
     """

     def setup_schema(self, cursor):
         cursor.execute("CREATE TABLE paging_test ( "
                        "id int, mytext text, col1 int, col2 int, col3 int, "
                        "PRIMARY KEY (id, mytext) )")

     def setup_data(self, cursor):

         def random_txt(text):
             return str(uuid.uuid4())

         data = """
              | id | mytext   | col1 | col2 | col3 |
           *40| 1  | [random] | 1    | 1    | 1    |
           *40| 2  | [random] | 2    | 2    | 2    |
           *40| 3  | [random] | 4    | 3    | 3    |
           *40| 4  | [random] | 4    | 4    | 4    |
           *40| 5  | [random] | 5    | 5    | 5    |
         """

         create_rows(data, cursor, 'paging_test', cl=CL.ALL,
                     format_funcs={
                         'id': int,
                         'mytext': random_txt,
                         'col1': int,
                         'col2': int,
                         'col3': int
                     })

         pf = self.get_page_fetcher(cursor)
         pf.request_all()
         return pf.all_data()

     def get_page_fetcher(self, cursor):
         future = cursor.execute_async(
             SimpleStatement("select * from paging_test where id in (1,2,3,4,5)", fetch_size=25,
                             consistency_level=CL.ALL)
         )

         return PageFetcher(future)

     def check_all_paging_results(self, cursor, expected_data, pagecount, num_page_results, timeout=None):
         """Check all paging results: pagecount, num_results per page, data."""

         page_size = 25
         expected_pages_data = [expected_data[x:x + page_size] for x in
                                range(0, len(expected_data), page_size)]

         pf = self.get_page_fetcher(cursor)
         pf.request_all(timeout=timeout)
         assert pf.pagecount() == pagecount
         assert pf.num_results_all() == num_page_results

         for i in range(pf.pagecount()):
             page_data = pf.page_data(i + 1)
             assert page_data == expected_pages_data[i]

     def test_single_partition_deletions(self):
         """Test single partition deletions """
         cursor = self.prepare()
         self.setup_schema(cursor)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")

             expected_data = self.setup_data(cursor)

             # Delete the a single partition at the beginning
             cursor.execute(
                 SimpleStatement("delete from paging_test where id = 1",
                                 consistency_level=CL.ALL)
             )
             expected_data = [row for row in expected_data if row['id'] != 1]
             self.check_all_paging_results(cursor, expected_data, 7,
                                           [25, 25, 25, 25, 25, 25, 10],
                                           timeout=10)

             # Delete the a single partition in the middle
             cursor.execute(
                 SimpleStatement("delete from paging_test where id = 3",
                                 consistency_level=CL.ALL)
             )
             expected_data = [row for row in expected_data if row['id'] != 3]
             self.check_all_paging_results(cursor, expected_data, 5, [25, 25, 25, 25, 20],
                                           timeout=10)

             # Delete the a single partition at the end
             cursor.execute(
                 SimpleStatement("delete from paging_test where id = 5",
                                 consistency_level=CL.ALL))
             expected_data = [row for row in expected_data if row['id'] != 5]
             self.check_all_paging_results(cursor, expected_data, 4, [25, 25, 25, 5],
                                           timeout=10)

             # Keep only the partition '2'
             cursor.execute(
                 SimpleStatement("delete from paging_test where id = 4",
                                 consistency_level=CL.ALL))
             expected_data = [row for row in expected_data if row['id'] != 4]
             self.check_all_paging_results(cursor, expected_data, 2, [25, 15],
                                           timeout=10)

     def test_multiple_partition_deletions(self):
         """Test multiple partition deletions """
         cursor = self.prepare()
         self.setup_schema(cursor)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")
             expected_data = self.setup_data(cursor)

             # Keep only the partition '1'
             cursor.execute(
                 SimpleStatement("delete from paging_test where id in (2,3,4,5)",
                                 consistency_level=CL.ALL)
             )
             expected_data = [row for row in expected_data if row['id'] == 1]
             self.check_all_paging_results(cursor, expected_data, 2, [25, 15],
                                           timeout=10)

     def test_single_row_deletions(self):
         """Test single row deletions """
         cursor = self.prepare()
         self.setup_schema(cursor)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")
             expected_data = self.setup_data(cursor)

             # Delete the first row
             row = expected_data.pop(0)
             cursor.execute(SimpleStatement(
                 ("delete from paging_test where "
                  "id = {} and mytext = '{}'".format(row['id'], row['mytext'])),
                 consistency_level=CL.ALL))
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 24])

             # Delete a row in the middle
             row = expected_data.pop(100)
             cursor.execute(SimpleStatement(
                 ("delete from paging_test where "
                  "id = {} and mytext = '{}'".format(row['id'], row['mytext'])),
                 consistency_level=CL.ALL)
             )
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 23])

             # Delete the last row
             row = expected_data.pop()
             cursor.execute(SimpleStatement(
                 ("delete from paging_test where "
                  "id = {} and mytext = '{}'".format(row['id'], row['mytext'])),
                 consistency_level=CL.ALL)
             )
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 22])

             # Delete all the last page row by row
             rows = expected_data[-22:]
             for row in rows:
                 cursor.execute(SimpleStatement(
                     ("delete from paging_test where "
                      "id = {} and mytext = '{}'".format(row['id'], row['mytext'])),
                     consistency_level=CL.ALL)
                 )
             self.check_all_paging_results(cursor, expected_data, 7,
                                           [25, 25, 25, 25, 25, 25, 25])

     def test_single_cell_deletions(self):
         """Test single cell deletions """
         cursor = self.prepare()
         self.setup_schema(cursor)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")
             expected_data = self.setup_data(cursor)

             # Delete the first cell of some rows of the last partition
             pkeys = [r['mytext'] for r in expected_data if r['id'] == 5][:20]
             for r in expected_data:
                 if r['id'] == 5 and r['mytext'] in pkeys:
                     r['col1'] = None

             for pkey in pkeys:
                 cursor.execute(SimpleStatement(
                     ("delete col1 from paging_test where id = 5 "
                      "and mytext = '{}'".format(pkey)),
                     consistency_level=CL.ALL))
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 25])

             # Delete the mid cell of some rows of the first partition
             pkeys = [r['mytext'] for r in expected_data if r['id'] == 1][20:]
             for r in expected_data:
                 if r['id'] == 1 and r['mytext'] in pkeys:
                     r['col2'] = None

             for pkey in pkeys:
                 cursor.execute(SimpleStatement(
                     ("delete col2 from paging_test where id = 1 "
                      "and mytext = '{}'".format(pkey)),
                     consistency_level=CL.ALL))
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 25])

             # Delete the last cell of all rows of the mid partition
             pkeys = [r['mytext'] for r in expected_data if r['id'] == 3]
             for r in expected_data:
                 if r['id'] == 3 and r['mytext'] in pkeys:
                     r['col3'] = None

             for pkey in pkeys:
                 cursor.execute(SimpleStatement(
                     ("delete col3 from paging_test where id = 3 "
                      "and mytext = '{}'".format(pkey)),
                     consistency_level=CL.ALL))
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 25])

     def test_multiple_cell_deletions(self):
         """Test multiple cell deletions """
         cursor = self.prepare()
         self.setup_schema(cursor)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")
             expected_data = self.setup_data(cursor)

             # Delete the multiple cells of some rows of the second partition
             pkeys = [r['mytext'] for r in expected_data if r['id'] == 2][20:]
             for r in expected_data:
                 if r['id'] == 2 and r['mytext'] in pkeys:
                     r['col1'] = None
                     r['col2'] = None

             for pkey in pkeys:
                 cursor.execute(SimpleStatement(
                     ("delete col1, col2 from paging_test where id = 2 "
                      "and mytext = '{}'".format(pkey)),
                     consistency_level=CL.ALL))
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 25])

             # Delete the multiple cells of all rows of the fourth partition
             pkeys = [r['mytext'] for r in expected_data if r['id'] == 4]
             for r in expected_data:
                 if r['id'] == 4 and r['mytext'] in pkeys:
                     r['col2'] = None
                     r['col3'] = None

             for pkey in pkeys:
                 cursor.execute(SimpleStatement(
                     ("delete col2, col3 from paging_test where id = 4 "
                      "and mytext = '{}'".format(pkey)),
                     consistency_level=CL.ALL))
             self.check_all_paging_results(cursor, expected_data, 8,
                                           [25, 25, 25, 25, 25, 25, 25, 25])

     def test_ttl_deletions(self):
         """Test ttl deletions. Paging over a query that has only tombstones """
         cursor = self.prepare()
         self.setup_schema(cursor)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")
             data = self.setup_data(cursor)

             # Set TTL to all row
             for row in data:
                 s = ("insert into paging_test (id, mytext, col1, col2, col3) "
                      "values ({}, '{}', {}, {}, {}) using ttl 3;").format(
                          row['id'], row['mytext'], row['col1'],
                          row['col2'], row['col3'])
                 cursor.execute(SimpleStatement(s, consistency_level=CL.ALL))
             time.sleep(5)
             self.check_all_paging_results(cursor, [], 0, [])

     def test_failure_threshold_deletions(self):
         """Test that paging throws a failure in case of tombstone threshold """
         self.fixture_dtest_setup.allow_log_errors = True
         cursor = self.prepare(
             extra_config_options={'tombstone_failure_threshold': 500,
                                   'read_request_timeout_in_ms': 1000,
                                   'request_timeout_in_ms': 1000,
                                   'range_request_timeout_in_ms': 1000})
         nodes = self.cluster.nodelist()
         self.setup_schema(cursor)

         for is_upgraded, cursor in self.do_upgrade(cursor, row_factory=dict_factory):
             logger.debug("Querying %s node" % ("upgraded" if is_upgraded else "old",))
             cursor.execute("TRUNCATE paging_test")
             self.setup_data(cursor)

             # Add more data
             values = [uuid.uuid4() for i in range(3000)]
             for value in values:
                 cursor.execute(SimpleStatement(
                     "insert into paging_test (id, mytext, col1) values (1, '{}', null) ".format(
                         value
                     ),
                     consistency_level=CL.ALL
                 ))

             stmt = SimpleStatement("select * from paging_test", fetch_size=1000, consistency_level=CL.ALL)
             assert_read_timeout_or_failure(cursor, stmt)

             # Grep each node in the cluster for aborted query logs
             self.cluster.timed_grep_nodes_for_patterns(LogPatternToVersion({"2.2": r"Scanned over.* tombstones in ks.paging_test.* query aborted",
                                                                             "3.0": r"Scanned over.* tombstones during query 'SELECT \* FROM ks.paging_test.* query aborted"}, default_pattern=""),
                                                        timeout_seconds=50)


 topology_specs = [
     {'NODES': 3,
      'RF': 3,
      'CL': CL.ALL},
     {'NODES': 2,
      'RF': 1},
 ]

 specs = [dict(s, UPGRADE_PATH=p, __test__=True)
          for s, p in itertools.product(topology_specs, build_upgrade_pairs())]

 for klaus in BasePagingTester.__subclasses__():
     for spec in specs:
         suffix = 'Nodes{num_nodes}RF{rf}_{pathname}'.format(num_nodes=spec['NODES'],
                                                             rf=spec['RF'],
                                                             pathname=spec['UPGRADE_PATH'].name)
         gen_class_name = klaus.__name__ + suffix
         assert gen_class_name not in globals()

         upgrade_applies_to_env = RUN_STATIC_UPGRADE_MATRIX or spec['UPGRADE_PATH'].upgrade_meta.matches_current_env_version_family
         cls = type(gen_class_name, (klaus,), spec)
         if not upgrade_applies_to_env:
             add_skip(cls, 'test not applicable to env.')
         globals()[gen_class_name] = cls