atong01 · kilianFatras · Aug 23, 2023 · Aug 15, 2023 · Aug 15, 2023 · Aug 15, 2023
diff --git a/examples/cifar10/cifar.ipynb b/examples/cifar10/cifar.ipynb
diff --git a/examples/cifar10/train_cifar10.py b/examples/cifar10/train_cifar10.py
@@ -0,0 +1,91 @@
+import os
+import matplotlib.pyplot as plt
+import numpy as np
+import torch
+import torchsde
+from torchdyn.core import NeuralODE
+from torchvision import datasets, transforms
+from torchvision.transforms import ToPILImage
+from torchvision.utils import make_grid
+from tqdm import tqdm
+from timm import scheduler
+
+from torchcfm.conditional_flow_matching import *
+from torchcfm.models.unet.unet import UNetModelWrapper
+
+
+def imshow(img):
+    img = img / 2 + 0.5     # unnormalize
+    npimg = img.numpy()
+    plt.imshow(np.transpose(npimg, (1, 2, 0)))
+    plt.savefig('imgs/cifar10_generated_images.png')
+    plt.show()
+
+
+savedir = "weights/"
+os.makedirs(savedir, exist_ok=True)
+
+use_cuda = torch.cuda.is_available()
+device = torch.device("cuda" if use_cuda else "cpu")
+batch_size = 256
+n_epochs = 1000
+
+transform = transforms.Compose(
+    [transforms.ToTensor(),
+     transforms.Normalize((0.5, 0.5, 0.5), (0.5, 0.5, 0.5))])
+
+trainset = datasets.CIFAR10(root='./data', train=True,
+                                        download=True, transform=transform)
+trainloader = torch.utils.data.DataLoader(trainset, batch_size=batch_size,
+                                          shuffle=True, num_workers=1)
+
+num_iter_per_epoch = int(50000/batch_size)
+
+#################################
+#            OT-CFM
+#################################
+
+sigma = 0.0
+#model = UNetModel(dim=(1, 28, 28), num_channels=32, num_res_blocks=1).to(device)
+model = UNetModelWrapper(
+    dim=(3, 32, 32),
+    num_res_blocks=2,
+    num_channels=64,
+    channel_mult=[1, 2, 2, 2],
+    num_heads=4,
+    num_head_channels=64,
+    attention_resolutions="16",
+    dropout=0).to(device)
+
+if torch.cuda.device_count() > 1:
+    print("Let's use", torch.cuda.device_count(), "GPUs!")
+    # dim = 0 [30, xxx] -> [10, ...], [10, ...], [10, ...] on 3 GPUs
+    model = torch.nn.DataParallel(model).cuda() 
+
+
+optimizer = torch.optim.Adam(model.parameters(), lr=0.0005)
+opt_scheduler = scheduler.PolyLRScheduler(warmup_t=45000, warmup_lr_init=1e-8, t_initial=196*n_epochs, optimizer=optimizer)
+# FM = ConditionalFlowMatcher(sigma=sigma)
+FM = ExactOptimalTransportConditionalFlowMatcher(sigma=sigma)
+node = NeuralODE(model, solver="euler", sensitivity="adjoint", atol=1e-4, rtol=1e-4)
+
+for epoch in range(n_epochs):
+    for i, data in tqdm(enumerate(trainloader)):
+        optimizer.zero_grad()
+        x1 = data[0].to(device)
+        x0 = torch.randn_like(x1)
+        t, xt, ut = FM.sample_location_and_conditional_flow(x0, x1)
+        vt = model(t, xt)
+        loss = torch.mean((vt - ut) ** 2)
+        loss.backward()
+        optimizer.step()
+        opt_scheduler.step(epoch*(num_iter_per_epoch + 1) + i)
+
+    ## Saving the weights
+    if (epoch + 1)%100==0:
+        torch.save({
+            'epoch': epoch,
+            'model_state_dict': model.state_dict(),
+            'optimizer_state_dict': optimizer.state_dict(),
+            'loss': loss,
+            }, 'weights/reproduced_cifar10_weights_epoch_{}.pt'.format(epoch))
diff --git a/examples/models/8gaussian-moons/action_matching_swish_v1.pt b/examples/models/8gaussian-moons/action_matching_swish_v1.pt
diff --git a/examples/models/8gaussian-moons/action_matching_v1.pt b/examples/models/8gaussian-moons/action_matching_v1.pt
diff --git a/examples/models/8gaussian-moons/cfm_v1.pt b/examples/models/8gaussian-moons/cfm_v1.pt
diff --git a/examples/models/8gaussian-moons/otcfm_v1.pt b/examples/models/8gaussian-moons/otcfm_v1.pt
diff --git a/examples/models/8gaussian-moons/rect_1_v1.pt b/examples/models/8gaussian-moons/rect_1_v1.pt
diff --git a/examples/models/8gaussian-moons/rect_2_v1.pt b/examples/models/8gaussian-moons/rect_2_v1.pt
diff --git a/examples/models/8gaussian-moons/rect_3_v1.pt b/examples/models/8gaussian-moons/rect_3_v1.pt
diff --git a/examples/models/8gaussian-moons/sbcfm_v1.pt b/examples/models/8gaussian-moons/sbcfm_v1.pt
diff --git a/examples/models/8gaussian-moons/stochastic_interpolant_v1.pt b/examples/models/8gaussian-moons/stochastic_interpolant_v1.pt
diff --git a/examples/models/gaussian-moons/action_matching_swish_v1.pt b/examples/models/gaussian-moons/action_matching_swish_v1.pt
diff --git a/examples/models/gaussian-moons/action_matching_v1.pt b/examples/models/gaussian-moons/action_matching_v1.pt
diff --git a/examples/models/gaussian-moons/cfm_v1.pt b/examples/models/gaussian-moons/cfm_v1.pt
diff --git a/examples/models/gaussian-moons/flow_matching_v1.pt b/examples/models/gaussian-moons/flow_matching_v1.pt
diff --git a/examples/models/gaussian-moons/otcfm_v1.pt b/examples/models/gaussian-moons/otcfm_v1.pt
diff --git a/examples/models/gaussian-moons/sbcfm_v1.pt b/examples/models/gaussian-moons/sbcfm_v1.pt
diff --git a/examples/models/gaussian-moons/stochastic_interpolant_v1.pt b/examples/models/gaussian-moons/stochastic_interpolant_v1.pt
diff --git a/examples/models/gaussian-moons/vp_flow_v1.pt b/examples/models/gaussian-moons/vp_flow_v1.pt
diff --git a/examples/SF2M_2D_example.ipynb → examples/notebooks/SF2M_2D_example.ipynb b/examples/SF2M_2D_example.ipynb → examples/notebooks/SF2M_2D_example.ipynb
diff --git a/examples/mnist_example.ipynb → examples/notebooks/mnist_example.ipynb b/examples/mnist_example.ipynb → examples/notebooks/mnist_example.ipynb
diff --git a/examples/model-comparison-plotting.ipynb → ...notebooks/model-comparison-plotting.ipynb b/examples/model-comparison-plotting.ipynb → ...notebooks/model-comparison-plotting.ipynb
diff --git a/...sing/1.0-embryoid_body_data_to_h5ad.ipynb → ...sing/1.0-embryoid_body_data_to_h5ad.ipynb b/...sing/1.0-embryoid_body_data_to_h5ad.ipynb → ...sing/1.0-embryoid_body_data_to_h5ad.ipynb
diff --git a/.../preprocessing/1.1-eb-data-1d-phate.ipynb → .../preprocessing/1.1-eb-data-1d-phate.ipynb b/.../preprocessing/1.1-eb-data-1d-phate.ipynb → .../preprocessing/1.1-eb-data-1d-phate.ipynb
diff --git a/...s/preprocessing/2.1-split-cite-data.ipynb → ...s/preprocessing/2.1-split-cite-data.ipynb b/...s/preprocessing/2.1-split-cite-data.ipynb → ...s/preprocessing/2.1-split-cite-data.ipynb
diff --git a/examples/preprocessing/README.md → examples/notebooks/preprocessing/README.md b/examples/preprocessing/README.md → examples/notebooks/preprocessing/README.md
diff --git a/examples/single-cell_example.ipynb → examples/notebooks/single-cell_example.ipynb b/examples/single-cell_example.ipynb → examples/notebooks/single-cell_example.ipynb
diff --git a/examples/training-8gaussians-to-moons.ipynb → ...ebooks/training-8gaussians-to-moons.ipynb b/examples/training-8gaussians-to-moons.ipynb → ...ebooks/training-8gaussians-to-moons.ipynb
diff --git a/torchcfm/models/unet/unet.py b/torchcfm/models/unet/unet.py
@@ -902,7 +902,7 @@ def __init__(
 
         return super().__init__(
             image_size=image_size,
-            in_channels=1,
+            in_channels=dim[0],
             model_channels=num_channels,
             out_channels=(dim[0] if not learn_sigma else dim[0] * 2),
             num_res_blocks=num_res_blocks,