more refactors in precision_recall_vs_calc_count.py and moving_hull_dist_mae_compare_models.py

janosh · janosh · commit 8daf74855a97 · 2023-06-19T20:29:21.000-07:00
diff --git a/mb_discovery/plot_scripts/plot_funcs.py b/mb_discovery/plot_scripts/plot_funcs.py
@@ -24,7 +24,7 @@
 plt.rc("savefig", bbox="tight", dpi=200)
 plt.rcParams["figure.constrained_layout.use"] = True
 plt.rc("figure", dpi=150)
-plt.rc("font", size=14)
+plt.rc("font", size=16)
 
 
 def hist_classify_stable_as_func_of_hull_dist(
diff --git a/mb_discovery/plot_scripts/precision_recall_vs_calc_count.py b/mb_discovery/plot_scripts/precision_recall_vs_calc_count.py
@@ -17,7 +17,7 @@
 plt.rc("savefig", bbox="tight", dpi=200)
 plt.rcParams["figure.constrained_layout.use"] = True
 plt.rc("figure", dpi=150)
-plt.rc("font", size=18)
+plt.rc("font", size=16)
 
 
 # %%
@@ -31,21 +31,27 @@
         f"{ROOT}/data/2022-06-11-from-rhys/{model_name}-mp-initial-structures.csv"
     ).set_index("material_id")
 
-dfs["m3gnet"] = pd.read_json(
-    f"{ROOT}/data/2022-08-16-m3gnet-wbm-relax-results.json.gz"
+dfs["M3GNet"] = pd.read_json(
+    f"{ROOT}/data/2022-08-16-m3gnet-wbm-relax-results-IS2RE.json.gz"
 ).set_index("material_id")
 
+dfs["Wrenformer"] = pd.read_csv(
+    f"{ROOT}/data/2022-08-16-wrenformer-ensemble-predictions.csv.bz2"
+).set_index("material_id")
+
+# dfs["Wrenformer"]["e_form_target"] = dfs["Wren"]["e_form_target"]
+# dfs["M3GNet"]["e_form_target"] = dfs["Wren"]["e_form_target"]
+
 
 # %%
 fig, ax = plt.subplots(1, 1, figsize=(10, 9))
 
 for model_name, color in zip(
-    ("Wren", "CGCNN", "Voronoi", "M3GNet"),
-    ("tab:blue", "tab:orange", "tab:red", "tab:green"),
+    ("Wren", "CGCNN", "Voronoi", "M3GNet", "Wrenformer"),
+    ("tab:blue", "tab:orange", "teal", "tab:pink", "black"),
+    strict=True,
 ):
     df = dfs[model_name]
-    df = df.rename(columns={"e_form_wbm": "e_form_target"})
-
     df["e_above_mp_hull"] = df_hull.e_above_mp_hull
 
     assert df.e_above_mp_hull.isna().sum() == 0
@@ -62,71 +68,83 @@
 
     e_above_mp_hull = df.e_above_mp_hull
 
-    if df.filter(regex=r"_pred_\d").shape[1] > 1:
-        assert df.filter(regex=r"_pred_\d").shape[1] == 10
-
-        model_preds = df.filter(regex=r"_pred_\d").mean(axis=1)
-
-    elif model_name == "M3GNet":
-        model_preds = df.e_form_m3gnet
-    else:
-        model_preds = df.e_form_pred
-
-    residual = model_preds - df[target_col] + e_above_mp_hull
+    try:
+        if model_name == "M3GNet":
+            model_preds = df.e_form_m3gnet
+            targets = df.e_form_wbm
+        elif model_name == "Wrenformer":
+            model_preds = df.e_form_pred_ens
+            targets = df.e_form
+        elif df.filter(regex=r"_pred_\d").shape[1] > 1:
+            assert df.filter(regex=r"_pred_\d").shape[1] == 10
+            model_preds = df.filter(regex=r"_pred_\d").mean(axis=1)
+            targets = df.e_form_target
+        elif "e_form_pred" in df and "e_form_target" in df:
+            model_preds = df.e_form_pred
+            targets = df.e_form_target
+        else:
+            raise ValueError(f"Unhandled {model_name = }")
+    except AttributeError as exc:
+        raise KeyError(f"{model_name = }") from exc
+
+    df["residual"] = model_preds - targets + df.e_above_mp_hull
+    df = df.sort_values(by="residual")
 
     # epistemic_var = df.filter(regex=r"_pred_\d").var(axis=1, ddof=0)
 
     # aleatoric_var = (df.filter(like="_ale_") ** 2).mean(axis=1)
 
-    # full_std = (epistemic_var + aleatoric_var) ** 0.5
+    # std_total = (epistemic_var + aleatoric_var) ** 0.5
 
     # criterion = "std"
-    # test = residual + full_std
+    # test = df.residual + std_total
 
     # criterion = "neg"
-    # test = residual - full_std
+    # test = df.residual - std_total
 
     criterion = "energy"
 
-    # thresh = 0.02
-    thresh = 0
-    # thresh = 0.10
+    # stability_thresh = 0.02
+    stability_thresh = 0
+    # stability_thresh = 0.10
 
-    n_true_pos = len(
-        e_above_mp_hull[(e_above_mp_hull <= thresh) & (residual <= thresh)]
+    true_pos_mask = (df.e_above_mp_hull <= stability_thresh) & (
+        df.residual <= stability_thresh
     )
-    n_false_neg = len(
-        e_above_mp_hull[(e_above_mp_hull <= thresh) & (residual > thresh)]
+    false_neg_mask = (df.e_above_mp_hull <= stability_thresh) & (
+        df.residual > stability_thresh
+    )
+    false_pos_mask = (df.e_above_mp_hull > stability_thresh) & (
+        df.residual <= stability_thresh
     )
 
-    n_total_pos = n_true_pos + n_false_neg
-
-    sort = np.argsort(residual)
-    e_above_mp_hull = e_above_mp_hull[sort]
-    residual = residual[sort]
-
-    e_type = "pred"
-    true_pos_cumsum = ((e_above_mp_hull <= thresh) & (residual <= thresh)).cumsum()
-    false_neg_cumsum = ((e_above_mp_hull <= thresh) & (residual > thresh)).cumsum()
-    false_pos_cumsum = ((e_above_mp_hull > thresh) & (residual <= thresh)).cumsum()
-    true_neg_cumsum = ((e_above_mp_hull > thresh) & (residual > thresh)).cumsum()
+    energy_type = "pred"
+    true_pos_cumsum = true_pos_mask.cumsum()
     xlabel = r"$\Delta E_{Hull-Pred}$ / eV per atom"
 
-    ppv = true_pos_cumsum / (true_pos_cumsum + false_pos_cumsum) * 100
+    ppv = true_pos_cumsum / (true_pos_cumsum + false_pos_mask.cumsum()) * 100
+    n_true_pos = sum(true_pos_mask)
+    n_false_neg = sum(false_neg_mask)
+    n_total_pos = n_true_pos + n_false_neg
     tpr = true_pos_cumsum / n_total_pos * 100
 
-    end = np.argmax(tpr)
+    end = int(np.argmax(tpr))
 
-    x = np.arange(len(ppv))[:end]
+    xs = np.arange(end)
 
-    precision_curve = interp1d(x, ppv[:end], kind="cubic")
-    rolling_recall_curve = interp1d(x, tpr[:end], kind="cubic")
+    precision_curve = interp1d(xs, ppv[:end], kind="cubic")
+    rolling_recall_curve = interp1d(xs, tpr[:end], kind="cubic")
 
     line_kwargs = dict(
-        linewidth=3, color=color, markevery=[-1], marker="x", markersize=14, mew=2.5
+        linewidth=3,
+        color=color,
+        markevery=[-1],
+        marker="x",
+        markersize=14,
+        markeredgewidth=2.5,
     )
-    ax.plot(x[::100], precision_curve(x[::100]), linestyle="-", **line_kwargs)
-    ax.plot(x[::100], rolling_recall_curve(x[::100]), linestyle=":", **line_kwargs)
+    ax.plot(xs, precision_curve(xs), linestyle="-", **line_kwargs)
+    ax.plot(xs, rolling_recall_curve(xs), linestyle=":", **line_kwargs)
     ax.plot((0, 0), (0, 0), label=model_name, **line_kwargs)
 
 
@@ -140,11 +158,11 @@
 [precision] = ax.plot((0, 0), (0, 0), "black", linestyle="-")
 [recall] = ax.plot((0, 0), (0, 0), "black", linestyle=":")
 ax.legend(
-    [precision, recall], ["Precision", "Recall"], frameon=False, loc="upper right"
+    [precision, recall], ("Precision", "Recall"), frameon=False, loc="upper right"
 )
 
 img_path = (
     f"{ROOT}/figures/{today}-precision-recall-vs-calc-count-"
-    f"{e_type=}-{criterion=}-{rare=}.pdf"
+    f"{energy_type=}-{criterion=}-{rare=}.pdf"
 )
 # plt.savefig(img_path)