update gaussian kernel

spencerbraun · spencerbraun · commit f9afe3da3904 · 2022-03-23T20:59:04.000-07:00
diff --git a/model.py b/model.py
@@ -38,11 +38,16 @@ def initialize(self, x):
         self.V = self.Wv(x)
         self.sigma = self.Ws(x)
 
+    @staticmethod
+    def gaussian_kernel(mean, sigma):
+        normalize = 1 / (math.sqrt(2 * torch.pi) * sigma)
+        return normalize * torch.exp(-0.5 * (mean / sigma).pow(2))
+
     def prior_association(self):
         p = torch.from_numpy(
             np.abs(np.indices((self.N, self.N))[0] - np.indices((self.N, self.N))[1])
         )
-        gaussian = torch.normal(p.float(), self.sigma[:, 0].abs())
+        gaussian = self.gaussian_kernel(p.float(), self.sigma)
         gaussian /= gaussian.sum(dim=-1).view(-1, 1)
 
         return gaussian
diff --git a/train.py b/train.py
@@ -40,7 +40,6 @@ def train(config, model, train_data, val_data):
     print("Warmup steps: {}".format(warmup_steps))
 
     num_steps = 0
-    best_f1 = 0
     model.train()
 
     for epoch in range(int(config.train.epochs)):
@@ -50,7 +49,8 @@ def train(config, model, train_data, val_data):
             outputs = model(batch)
             min_loss = model.min_loss(batch)
             max_loss = model.max_loss(batch)
-            (min_loss - max_loss).backward()
+            min_loss.backward(retain_graph=True)
+            max_loss.backward()
 
             torch.nn.utils.clip_grad_norm_(
                 model.parameters(), config.train.max_grad_norm
@@ -64,32 +64,9 @@ def train(config, model, train_data, val_data):
             if not config.debug:
                 wandb.log({"loss": loss.item()}, step=num_steps)
 
-        output = validate(config, model, val_data)
         if not config.debug:
             wandb.log(output, step=num_steps)
-
-            if output["validation_f1"] > best_f1:
-                print(f"Best validation F1! Saving to {config.train.pt}")
-                torch.save(model.state_dict(), config.train.pt)
-
-        best_f1 = max(best_f1, output["validation_f1"])
-
-
-def validate(config, model, data):
-
-    model.eval()
-    with torch.no_grad():
-        outputs = []
-        for batch in tqdm(data):
-            outputs.append(model(batch))
-        outputs = torch.cat(outputs)
-        outputs = outputs.cpu().numpy()
-        outputs = np.argmax(outputs, axis=1)
-        outputs = outputs.flatten()
-        labels = data.dataset.labels.cpu().numpy()
-        labels = labels.flatten()
-        f1 = f1_score(labels, outputs, average="macro")
-        return {"validation_f1": f1}
+            torch.save(model.state_dict(), config.train.pt)
 
 
 @hydra.main(config_path="./conf", config_name="config")