commit	295358095db80ced4b8f54f603f7bd9833a8f175	[log] [tgz]
author	Francisco Guerrero <frankgh@apache.org>	Tue Apr 02 16:26:40 2024 -0700
committer	GitHub <noreply@github.com>	Tue Apr 02 16:26:40 2024 -0700
tree	11f8229c457dd575321893c5fd544b90b34cbfcc
parent	c5d6dfd1bc9b682d704d28f77807ba72317b1944 [diff]

CASSANDRA-19513: Refactor Cassandra bridge (#48)

This commit splits the bridge implementation from the shaded `cassandra-all` library. This separation
allows for better integration of a different `cassandra-all` implementations. Additionally, it better
separates the actual bridge code from the Cassandra code.

Patch by Francisco Guerrero; Reviewed by Yifan Cai for CASSANDRA-19513

cassandra-analytics-core/build.gradle[diff]
cassandra-analytics-core/src/main/java/org/apache/cassandra/bridge/CassandraBridgeFactory.java[diff]
cassandra-analytics-core/src/main/java/org/apache/cassandra/bridge/PostDelegationClassLoader.java[diff]
cassandra-analytics-core/src/main/java/org/apache/cassandra/spark/bulkwriter/BulkSparkConf.java[diff]
cassandra-analytics-core/src/main/java/org/apache/cassandra/spark/bulkwriter/DigestAlgorithmSupplier.java[diff]
cassandra-analytics-core/src/main/java/org/apache/cassandra/spark/sparksql/CassandraDataSink.java[diff]
cassandra-analytics-core/src/main/java/org/apache/cassandra/spark/validation/KeyStoreValidation.java[diff]
cassandra-analytics-core/src/main/spark2/org/apache/cassandra/spark/sparksql/CassandraDataSource.java[diff]
cassandra-analytics-core/src/main/spark3/org/apache/cassandra/spark/sparksql/CassandraDataSource.java[diff]
cassandra-analytics-core/src/main/spark3/org/apache/cassandra/spark/sparksql/CassandraTableProvider.java[diff]
cassandra-analytics-core/src/test/java/org/apache/cassandra/secrets/TestSecretsProvider.java[diff]
cassandra-analytics-core/src/test/java/org/apache/cassandra/spark/SSTableReaderTests.java[Added - diff]
cassandra-analytics-core/src/test/java/org/apache/cassandra/spark/Tester.java[diff]
cassandra-analytics-core/src/test/java/org/apache/cassandra/spark/utils/CqlUtilsTest.java[diff]
cassandra-analytics-integration-framework/src/main/java/org/apache/cassandra/sidecar/testing/SharedClusterIntegrationTestBase.java[diff]
cassandra-analytics-integration-tests/src/test/java/org/apache/cassandra/analytics/BulkWriteUdtTest.java[diff]
cassandra-analytics-integration-tests/src/test/java/org/apache/cassandra/analytics/QuoteIdentifiersWriteTest.java[diff]
cassandra-analytics-integration-tests/src/test/java/org/apache/cassandra/analytics/SharedClusterSparkIntegrationTestBase.java[diff]
cassandra-bridge/build.gradle[diff]
cassandra-bridge/src/main/java/org/apache/cassandra/bridge/CassandraVersion.java[diff]
cassandra-four-zero-bridge/build.gradle[Added - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/bridge/CassandraBridgeImplementation.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/bridge/CassandraBridgeImplementation.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/bridge/CassandraSchema.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/bridge/CassandraSchema.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/bridge/CollectionElement.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/bridge/CollectionElement.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/bridge/SSTableWriterImplementation.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/bridge/SSTableWriterImplementation.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/cql3/functions/types/TupleHelper.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/cql3/functions/types/TupleHelper.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/cql3/functions/types/UserTypeHelper.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/cql3/functions/types/UserTypeHelper.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/io/sstable/SSTableTombstoneWriter.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/io/sstable/SSTableTombstoneWriter.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/CqlType.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/CqlType.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/NativeType.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/NativeType.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/complex/CqlCollection.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/complex/CqlCollection.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/complex/CqlFrozen.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/complex/CqlFrozen.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/complex/CqlList.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/complex/CqlList.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/complex/CqlMap.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/complex/CqlMap.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/complex/CqlSet.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/complex/CqlSet.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/complex/CqlTuple.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/complex/CqlTuple.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/complex/CqlUdt.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/complex/CqlUdt.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Ascii.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Ascii.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/BigInt.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/BigInt.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/BinaryBased.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/BinaryBased.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Blob.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Blob.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Boolean.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Boolean.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Counter.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Counter.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Date.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Date.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Decimal.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Decimal.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Double.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Double.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Duration.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Duration.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Empty.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Empty.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Float.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Float.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Inet.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Inet.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Int.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Int.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/LongBased.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/LongBased.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/SmallInt.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/SmallInt.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/StringBased.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/StringBased.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Text.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Text.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Time.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Time.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/TimeUUID.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/TimeUUID.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/Timestamp.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/Timestamp.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/TinyInt.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/TinyInt.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/UUID.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/UUID.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/VarChar.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/VarChar.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/data/types/VarInt.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/data/types/VarInt.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/AbstractStreamScanner.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/AbstractStreamScanner.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/CompactionStreamScanner.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/CompactionStreamScanner.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/CompressedRawInputStream.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/CompressedRawInputStream.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/CompressionMetadata.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/CompressionMetadata.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/CompressionUtils.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/CompressionUtils.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/IndexDbUtils.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/IndexDbUtils.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/IndexReader.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/IndexReader.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/ReaderUtils.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/ReaderUtils.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/SSTableCache.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/SSTableCache.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/SSTableReader.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/SSTableReader.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/Scannable.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/Scannable.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/SchemaBuilder.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/SchemaBuilder.java - diff]
cassandra-four-zero-bridge/src/main/java/org/apache/cassandra/spark/reader/SummaryDbUtils.java[Renamed from cassandra-four-zero/src/main/java/org/apache/cassandra/spark/reader/SummaryDbUtils.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/bridge/SSTableWriterImplementationTest.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/bridge/SSTableWriterImplementationTest.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/TestDataLayer.java[Added - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/TestUtils.java[Added - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/data/types/DateTypeTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/data/types/DateTypeTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/IndexDbTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/IndexDbTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/IndexOffsetTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/IndexOffsetTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/IndexReaderTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/IndexReaderTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/PartitionKeyTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/PartitionKeyTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/ReaderUtilsTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/ReaderUtilsTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/SSTableCacheTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/SSTableCacheTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/SSTableReaderTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/SSTableReaderTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/SchemaBuilderTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/SchemaBuilderTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/spark/reader/SummaryDbTests.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/spark/reader/SummaryDbTests.java - diff]
cassandra-four-zero-bridge/src/test/java/org/apache/cassandra/utils/ReflectionUtils.java[Renamed from cassandra-four-zero/src/test/java/org/apache/cassandra/utils/ReflectionUtils.java - diff]
cassandra-four-zero/build.gradle[diff]
gradle.properties[diff]
scripts/relocate-dtest-dependencies.pom[diff]
settings.gradle[diff]

93 files changed

tree: 11f8229c457dd575321893c5fd544b90b34cbfcc

README.md

Cassandra Analytics

Cassandra Spark Bulk Reader

The open-source repository for the Cassandra Spark Bulk Reader. This library allows integration between Cassandra and Spark job, allowing users to run arbitrary Spark jobs against a Cassandra cluster securely and consistently.

This project contains the necessary open-source implementations to connect to a Cassandra cluster and read the data into Spark.

For example usage, see the example repository; sample steps:

import org.apache.cassandra.spark.sparksql.CassandraDataSource
import org.apache.spark.sql.SparkSession

val sparkSession = SparkSession.builder.getOrCreate()
val df = sparkSession.read.format("org.apache.cassandra.spark.sparksql.CassandraDataSource")
                          .option("sidecar_instances", "localhost,localhost2,localhost3")
                          .option("keyspace", "sbr_tests")
                          .option("table", "basic_test")
                          .option("DC", "datacenter1")
                          .option("createSnapshot", true)
                          .option("numCores", 4)
                          .load()

Cassandra Spark Bulk Writer

The Cassandra Spark Bulk Writer allows for high-speed data ingest to Cassandra clusters running Cassandra 3.0 and 4.0.

Developers interested in contributing to the Analytics library, please see the DEV-README.

Getting Started

For example usage, see the example repository. This example covers both setting up Cassandra 4.0, Apache Sidecar, and running a Spark Bulk Reader and Spark Bulk Writer job.