readability

asl3 · asl3 · commit 8ee878c826c6 · 2025-07-18T16:10:20.000-07:00
diff --git a/python/pyspark/sql/pandas/serializers.py b/python/pyspark/sql/pandas/serializers.py
@@ -211,20 +211,16 @@ class ArrowBatchUDFSerializer(ArrowStreamUDFSerializer):
 
     def __init__(
         self,
-        assign_cols_by_name,
         input_types,
-        struct_in_pandas="row",
-        ndarray_as_list=True,
-        return_type=None,
         prefers_large_var_types=False,
     ):
         super(ArrowBatchUDFSerializer, self).__init__()
-        self._assign_cols_by_name = assign_cols_by_name
         self._input_types = input_types
-        self._struct_in_pandas = struct_in_pandas
-        self._ndarray_as_list = ndarray_as_list
-        self._return_type = return_type
         self._prefers_large_var_types = prefers_large_var_types
+        self._assign_cols_by_name = False
+        self._struct_in_pandas = "row"
+        self._ndarray_as_list = True
+        self._return_type = None
 
     def convert_arrow_to_rows(self, *args):
         """
diff --git a/python/pyspark/worker.py b/python/pyspark/worker.py
@@ -2003,14 +2003,7 @@ def read_udfs(pickleSer, infile, eval_type):
             ser = ArrowStreamArrowUDFSerializer(timezone, safecheck, _assign_cols_by_name, False)
         elif eval_type == PythonEvalType.SQL_ARROW_BATCHED_UDF and not use_legacy_pandas_udf_conversion(runner_conf):
             input_types = ([f.dataType for f in _parse_datatype_json_string(utf8_deserializer.loads(infile))])
-            ser = ArrowBatchUDFSerializer(
-                False,
-                input_types,
-                "row",
-                True,
-                None,
-                use_large_var_types(runner_conf)
-            )
+            ser = ArrowBatchUDFSerializer(input_types, use_large_var_types(runner_conf))
         else:
             # Scalar Pandas UDF handles struct type arguments as pandas DataFrames instead of
             # pandas Series. See SPARK-27240.
@@ -2388,7 +2381,6 @@ def mapper(a):
             df2_keys = [a[1][o] for o in parsed_offsets[1][0]]
             df2_vals = [a[1][o] for o in parsed_offsets[1][1]]
             return f(df1_keys, df1_vals, df2_keys, df2_vals)
-
     elif eval_type == PythonEvalType.SQL_COGROUPED_MAP_ARROW_UDF:
         import pyarrow as pa