Spark: Do not redistribute MERGE INTO rows unless the table is sorted (#2139)

commit: d83796b0ee92071949aa59ee227b25a1bfaedf77 [log] [tgz]
author: Ryan Blue <blue@apache.org> Fri Jan 22 13:58:00 2021 -0800
committer: GitHub <noreply@github.com> Fri Jan 22 13:58:00 2021 -0800
tree: 33789e32b73e3914629dfb6f694d6ce32004829c
parent: ca0c7a2322557656c4b3851bff8fac182b0c033b [diff]
diff --git a/spark3-extensions/src/main/scala/org/apache/spark/sql/catalyst/optimizer/RewriteMergeInto.scala b/spark3-extensions/src/main/scala/org/apache/spark/sql/catalyst/optimizer/RewriteMergeInto.scala
index ef55a8d..b6322de 100644
--- a/spark3-extensions/src/main/scala/org/apache/spark/sql/catalyst/optimizer/RewriteMergeInto.scala
+++ b/spark3-extensions/src/main/scala/org/apache/spark/sql/catalyst/optimizer/RewriteMergeInto.scala

@@ -236,12 +236,19 @@
   def buildWritePlan(
      childPlan: LogicalPlan,
      table: Table): LogicalPlan = {
+    val defaultDistributionMode = table match {
+      case iceberg: SparkTable if !iceberg.table.sortOrder.isUnsorted =>
+        TableProperties.WRITE_DISTRIBUTION_MODE_RANGE
+      case _ =>
+        TableProperties.WRITE_DISTRIBUTION_MODE_DEFAULT
+    }
+
     table match {
       case iceTable: SparkTable =>
         val numShufflePartitions = spark.sessionState.conf.numShufflePartitions
         val table = iceTable.table()
         val distributionMode: String = table.properties
-          .getOrDefault(TableProperties.WRITE_DISTRIBUTION_MODE, TableProperties.WRITE_DISTRIBUTION_MODE_RANGE)
+          .getOrDefault(TableProperties.WRITE_DISTRIBUTION_MODE, defaultDistributionMode)
         val order = toCatalyst(toOrderedDistribution(table.spec(), table.sortOrder(), true), childPlan)
         DistributionMode.fromName(distributionMode) match {
           case DistributionMode.NONE =>
commit	d83796b0ee92071949aa59ee227b25a1bfaedf77	[log] [tgz]
author	Ryan Blue <blue@apache.org>	Fri Jan 22 13:58:00 2021 -0800
committer	GitHub <noreply@github.com>	Fri Jan 22 13:58:00 2021 -0800
tree	33789e32b73e3914629dfb6f694d6ce32004829c
parent	ca0c7a2322557656c4b3851bff8fac182b0c033b [diff]