fix the UTs

tchow-zlai · thomaschow · tchow-zlai · commit 935b6146e836 · 2025-04-17T17:44:24.000-07:00
Co-authored-by: Thomas Chow &lt;thomaschow369@gmail.com&gt;
diff --git a/spark/src/main/scala/ai/chronon/spark/TableUtils.scala b/spark/src/main/scala/ai/chronon/spark/TableUtils.scala
@@ -118,7 +118,7 @@ class TableUtils(@transient val sparkSession: SparkSession) extends Serializable
   def loadTable(tableName: String, rangeWheres: Seq[String] = List.empty[String]): DataFrame = {
     tableFormatProvider
       .readFormat(tableName)
-      .map(_.table(tableName, combinePredicates(rangeWheres))(sparkSession))
+      .map(_.table(tableName, andPredicates(rangeWheres))(sparkSession))
       .getOrElse(
         throw new RuntimeException(s"Could not load table: ${tableName} with partition filter: ${rangeWheres}"))
   }
@@ -568,7 +568,7 @@ class TableUtils(@transient val sparkSession: SparkSession) extends Serializable
     }
   }
 
-  private def combinePredicates(predicates: Seq[String]): String = {
+  private def andPredicates(predicates: Seq[String]): String = {
     val whereStr = predicates.map(p => s"($p)").mkString(" AND ")
     logger.info(s"""Where str: $whereStr""")
     whereStr
@@ -597,7 +597,7 @@ class TableUtils(@transient val sparkSession: SparkSession) extends Serializable
     if (selects.nonEmpty) df = df.selectExpr(selects: _*)
 
     if (wheres.nonEmpty) {
-      val whereStr = combinePredicates(wheres)
+      val whereStr = andPredicates(wheres)
       logger.info(s"""Where str: $whereStr""")
       df = df.where(whereStr)
     }
diff --git a/spark/src/main/scala/ai/chronon/spark/format/Format.scala b/spark/src/main/scala/ai/chronon/spark/format/Format.scala
@@ -9,9 +9,12 @@ trait Format {
   @transient protected lazy val logger: Logger = LoggerFactory.getLogger(getClass)
 
   def table(tableName: String, partitionFilters: String)(implicit sparkSession: SparkSession): DataFrame = {
-    sparkSession.read
-      .table(tableName)
-      .where(partitionFilters)
+    val df = sparkSession.read.table(tableName)
+    if (partitionFilters.isEmpty) {
+      df
+    } else {
+      df.where(partitionFilters)
+    }
   }
 
   // Return the primary partitions (based on the 'partitionColumn') filtered down by sub-partition filters if provided

Original file line number	Diff line number	Diff line change
`@@ -118,7 +118,7 @@ class TableUtils(@transient val sparkSession: SparkSession) extends Serializable`
`118`	`118`	`def loadTable(tableName: String, rangeWheres: Seq[String] = List.empty[String]): DataFrame = {`
`119`	`119`	`tableFormatProvider`
`120`	`120`	`.readFormat(tableName)`
`121`		`- .map(_.table(tableName, combinePredicates(rangeWheres))(sparkSession))`
	`121`	`+ .map(_.table(tableName, andPredicates(rangeWheres))(sparkSession))`
`122`	`122`	`.getOrElse(`
`123`	`123`	`throw new RuntimeException(s"Could not load table: ${tableName} with partition filter: ${rangeWheres}"))`
`124`	`124`	`}`
`@@ -568,7 +568,7 @@ class TableUtils(@transient val sparkSession: SparkSession) extends Serializable`
`568`	`568`	`}`
`569`	`569`	`}`
`570`	`570`
`571`		`- private def combinePredicates(predicates: Seq[String]): String = {`
	`571`	`+ private def andPredicates(predicates: Seq[String]): String = {`
`572`	`572`	`val whereStr = predicates.map(p => s"($p)").mkString(" AND ")`
`573`	`573`	`logger.info(s"""Where str: $whereStr""")`
`574`	`574`	`whereStr`
`@@ -597,7 +597,7 @@ class TableUtils(@transient val sparkSession: SparkSession) extends Serializable`
`597`	`597`	`if (selects.nonEmpty) df = df.selectExpr(selects: _*)`
`598`	`598`
`599`	`599`	`if (wheres.nonEmpty) {`
`600`		`- val whereStr = combinePredicates(wheres)`
	`600`	`+ val whereStr = andPredicates(wheres)`
`601`	`601`	`logger.info(s"""Where str: $whereStr""")`
`602`	`602`	`df = df.where(whereStr)`
`603`	`603`	`}`