import ChangeLog from ‘../changelog/connector-cloudberry.md’;
JDBC Cludberry源连接器
Spark
Flink
SeaTunnel Zeta
- 您需要确保jdbc驱动程序jar包已放置在目录
${SEATUNNEL_HOME}/plugins/
中。
- 您需要确保jdbc驱动程序jar包已放置在目录
${SEATUNNEL_HOME}/lib/
中。
支持查询SQL,可以实现映射效果。
通过 JDBC 读取外部数据源的数据。Cloudberry 暂未提供原生 JDBC 的驱动,需使用 PostgreSQL的 驱动程序和实现。
数据源 | 支持的版本 | 驱动程序 | URL | Maven |
---|---|---|---|---|
Cloudberry | 使用 PostgreSQL 驱动实现 | org.postgresql.Driver | jdbc:postgresql://localhost:5432/test | 下载 |
请下载PostgreSQL驱动程序的jar包,并将其复制到
${SEATUNNEL_HOME}/plugins/jdbc/lib/
工作目录下。
例如:cp postgresql-xxx.jar $SEATUNNEL_HOME/plugins/jdbc/lib/
Cloudberry 使用 PostgreSQL 的数据类型实现。有关数据类型的兼容性和映射关系,请参考 PostgreSQL 文档。
Cloudberry 连接器使用与 PostgreSQL 相同的配置项。有关详细的配置选项,请参考 PostgreSQL 连接器文档。
关键配置项包括:
Cloudberry 支持与 PostgreSQL 连接器相同的并行读取规则。有关切片策略和并行读取选项的详细信息,请参考 PostgreSQL 连接器文档。
env { parallelism = 4 job.mode = "BATCH" } source { Jdbc { url = "jdbc:postgresql://localhost:5432/cloudberrydb" driver = "org.postgresql.Driver" user = "dbadmin" password = "password" query = "select * from mytable limit 100" } } sink { Console {} }
env { parallelism = 4 job.mode = "BATCH" } source { Jdbc { url = "jdbc:postgresql://localhost:5432/cloudberrydb" driver = "org.postgresql.Driver" user = "dbadmin" password = "password" table_path = "public.mytable" split.size = 10000 } } sink { Console {} }
env { job.mode = "BATCH" parallelism = 4 } source { Jdbc { url = "jdbc:postgresql://localhost:5432/cloudberrydb" driver = "org.postgresql.Driver" user = "dbadmin" password = "password" "table_list" = [ { "table_path" = "public.table1" }, { "table_path" = "public.table2" } ] split.size = 10000 } } sink { Console {} }
有关更详细的示例和配置,请参阅PostgreSQL连接器文档。