SQOOP-2257: Parquet target for imports with Hive overwrite option does not work (Qian Xu via Jarek Jarcec Cecho)

commit: fa8518998f527653587c8f74ebf9990c22842dbb [log] [tgz]
author: Jarek Jarcec Cecho <jarcec@apache.org> Tue Mar 24 06:43:30 2015 -0700
committer: Jarek Jarcec Cecho <jarcec@apache.org> Tue Mar 24 06:43:30 2015 -0700
tree: add5acd999aec447adfc56f1ea78f5d6cb050f0c
parent: 38c054d8a28f7f695ccbb1348443e2631423806e [diff]
diff --git a/src/java/org/apache/sqoop/mapreduce/DataDrivenImportJob.java b/src/java/org/apache/sqoop/mapreduce/DataDrivenImportJob.java
index 708da5b..bcf6611 100644
--- a/src/java/org/apache/sqoop/mapreduce/DataDrivenImportJob.java
+++ b/src/java/org/apache/sqoop/mapreduce/DataDrivenImportJob.java

@@ -103,7 +103,9 @@
       // Parquet data records. The import will fail, if schema is invalid.
       Schema schema = generateAvroSchema(tableName);
       String uri = getKiteUri(conf, tableName);
-      ParquetJob.configureImportJob(conf, schema, uri, options.isAppendMode());
+      boolean reuseExistingDataset = options.isAppendMode() ||
+          (options.doHiveImport() && options.doOverwriteHiveTable());
+      ParquetJob.configureImportJob(conf, schema, uri, reuseExistingDataset);
     }
 
     job.setMapperClass(getMapperClass());

diff --git a/src/java/org/apache/sqoop/mapreduce/ParquetJob.java b/src/java/org/apache/sqoop/mapreduce/ParquetJob.java
index bea74c3..85d88ff 100644
--- a/src/java/org/apache/sqoop/mapreduce/ParquetJob.java
+++ b/src/java/org/apache/sqoop/mapreduce/ParquetJob.java

@@ -71,9 +71,9 @@
    * {@link org.apache.avro.generic.GenericRecord}.
    */
   public static void configureImportJob(Configuration conf, Schema schema,
-      String uri, boolean doAppend) throws IOException {
+      String uri, boolean reuseExistingDataset) throws IOException {
     Dataset dataset;
-    if (doAppend) {
+    if (reuseExistingDataset) {
       try {
         dataset = Datasets.load(uri);
       } catch (DatasetNotFoundException ex) {
commit	fa8518998f527653587c8f74ebf9990c22842dbb	[log] [tgz]
author	Jarek Jarcec Cecho <jarcec@apache.org>	Tue Mar 24 06:43:30 2015 -0700
committer	Jarek Jarcec Cecho <jarcec@apache.org>	Tue Mar 24 06:43:30 2015 -0700
tree	add5acd999aec447adfc56f1ea78f5d6cb050f0c
parent	38c054d8a28f7f695ccbb1348443e2631423806e [diff]