prepare for vision aided discriminator, make sure it can be saved and loaded, including optimizer and grad scaler

lucidrains · lucidrains · commit 60e261fb547a · 2023-07-20T17:00:52.000-07:00
diff --git a/gigagan_pytorch/gigagan_pytorch.py b/gigagan_pytorch/gigagan_pytorch.py
@@ -952,7 +952,7 @@ def init_(self, m):
 
     @property
     def total_params(self):
-        return sum([p.numel() for p in self.parameters()])
+        return sum([p.numel() for p in self.parameters() if p.requires_grad])
 
     @property
     def device(self):
@@ -1163,17 +1163,23 @@ class VisionAidedDiscriminator(nn.Module):
     def __init__(
         self,
         *,
-        clip: OpenClipAdapter,
         depth = 2,
         dim_head = 64,
         heads = 8,
+        clip: Optional[OpenClipAdapter] = None,
         layer_indices = (-1, -2, -3),
         conv_dim = None,
         text_dim = None,
         unconditional = False,
         num_conv_kernels = 2
     ):
         super().__init__()
+
+        if not exists(clip):
+            clip = OpenClipAdapter()
+
+        set_requires_grad_(clip, False)
+
         self.clip = clip
         dim = clip._dim_image_latent
 
@@ -1198,11 +1204,9 @@ def __init__(
                 )
             ]))
 
-    def parameters(self):
-        return [
-            *self.network.parameters(),
-            *self.to_pred.parameters()
-        ]
+    @property
+    def total_params(self):
+        return sum([p.numel() for p in self.parameters() if p.requires_grad])
 
     @beartype
     def forward(
@@ -1666,6 +1670,7 @@ def __init__(
         *,
         generator: Union[BaseGenerator, Dict],
         discriminator: Union[Discriminator, Dict],
+        vision_aided_discriminator: Optional[Union[VisionAidedDiscriminator, Dict]] = None,
         learning_rate = 2e-4,
         betas = (0.5, 0.9),
         weight_decay = 0.,
@@ -1730,12 +1735,16 @@ def __init__(
         if isinstance(discriminator, dict):
             discriminator = Discriminator(**discriminator)
 
+        if exists(vision_aided_discriminator) and isinstance(vision_aided_discriminator, dict):
+            vision_aided_discriminator = VisionAidedDiscriminator(**vision_aided_discriminator)
+
         assert isinstance(generator, generator_klass)
 
         # use _base to designate unwrapped models
 
         self.G = generator
         self.D = discriminator
+        self.VD = vision_aided_discriminator
 
         # ema
 
@@ -1746,8 +1755,13 @@ def __init__(
 
         # print number of parameters
 
-        self.print(f'Generator parameters: {numerize.numerize(generator.total_params)}')
-        self.print(f'Discriminator parameters: {numerize.numerize(discriminator.total_params)}')
+        self.print(f'Generator: {numerize.numerize(generator.total_params)}')
+        self.print(f'Discriminator: {numerize.numerize(discriminator.total_params)}')
+
+        if exists(self.VD):
+            self.print(f'Vision Discriminator: {numerize.numerize(vision_aided_discriminator.total_params)}')
+
+        self.print('\n')
 
         # text encoder
 
@@ -1764,6 +1778,12 @@ def __init__(
 
         self.G, self.D, self.G_opt, self.D_opt = self.accelerator.prepare(self.G, self.D, self.G_opt, self.D_opt)
 
+        # vision aided discriminator optimizer
+
+        if exists(self.VD):
+            self.VD_opt = get_optimizer(self.VD.parameters(), lr = learning_rate, betas = betas, weight_decay = weight_decay)
+            self.VD_opt = self.accelerator.prepare(self.VD_opt)
+
         # loss related
 
         self.discr_aux_recon_loss_weight = discr_aux_recon_loss_weight
@@ -1816,6 +1836,13 @@ def save(self, path, overwrite = True):
         if exists(self.D_opt.scaler):
             pkg['D_scaler'] = self.D_opt.scaler.state_dict()
 
+        if exists(self.VD):
+            pkg['VD'] = self.unwrapped_VD.state_dict()
+            pkg['VD_opt'] = self.VD_opt.state_dict()
+
+            if exists(self.VD_opt.scaler):
+                pkg['VD_scaler'] = self.VD_opt.scaler.state_dict()
+
         if self.has_ema_generator:
             pkg['G_ema'] = self.G_ema.state_dict()
 
@@ -1833,6 +1860,9 @@ def load(self, path, strict = False):
         self.unwrapped_G.load_state_dict(pkg['G'], strict = strict)
         self.unwrapped_D.load_state_dict(pkg['D'], strict = strict)
 
+        if exists(self.VD):
+            self.unwrapped_VD.load_state_dict(pkg['VD'], strict = strict)
+
         if self.has_ema_generator:
             self.G_ema.load_state_dict(pkg['G_ema'])
 
@@ -1846,12 +1876,18 @@ def load(self, path, strict = False):
             self.G_opt.load_state_dict(pkg['G_opt'])
             self.D_opt.load_state_dict(pkg['D_opt'])
 
+            if exists(self.VD):
+                self.VD_opt.load_state_dict(pkg['VD_opt'])
+
             if 'G_scaler' in pkg and exists(self.G_opt.scaler):
                 self.G_opt.scaler.load_state_dict(pkg['G_scaler'])
 
             if 'D_scaler' in pkg and exists(self.D_opt.scaler):
                 self.D_opt.scaler.load_state_dict(pkg['D_scaler'])
 
+            if 'VD_scaler' in pkg and exists(self.VD_opt.scaler):
+                self.VD_opt.scaler.load_state_dict(pkg['VD_scaler'])
+
         except Exception as e:
             self.print(f'unable to load optimizers {e.msg}- optimizer states will be reset')
             pass
@@ -1870,6 +1906,10 @@ def unwrapped_G(self):
     def unwrapped_D(self):
         return self.accelerator.unwrap_model(self.D)
 
+    @property
+    def unwrapped_VD(self):
+        return self.accelerator.unwrap_model(self.VD)
+
     def print(self, msg):
         self.accelerator.print(msg)
 
diff --git a/gigagan_pytorch/version.py b/gigagan_pytorch/version.py
@@ -1 +1 @@
-__version__ = '0.1.11'
+__version__ = '0.1.12'

Original file line number	Diff line number	Diff line change
`@@ -1 +1 @@`
`1`		`-__version__ = '0.1.11'`
	`1`	`+__version__ = '0.1.12'`