maxmo2009

Sync from local: code + epoch-110 checkpoint, clean README

2af0e94 verified 8 days ago

26.6 kB

	from torch import nn
	import torch
	import numpy as np
	from torch.nn.utils.stateless import functional_call

	import Diffusion.utils_diff as utils
	from Diffusion.networks import *
	# from networks import *

	import random

	EPS = 1e-8



	class DeformDDPM(nn.Module):
	def __init__(
	self,
	network,
	n_steps=50,
	beta_schedule_fn = None,
	device='cpu',
	image_chw=(1, 28, 28),
	batch_size = 1,
	img_pad_mode = "zeros",
	ddf_pad_mode="border",
	padding_mode="border",
	v_scale = 0.008/256,
	resample_mode=None,
	inf_mode = False,
	):
	super(DeformDDPM, self).__init__()
	self.rec_num=2
	self.ndims=len(image_chw)-1
	self.n_steps = n_steps
	self.v_scale = v_scale
	self.device = device
	self.msk_noise_scale = torch.tensor(0)
	# self.msk_noise_scale = torch.tensor(1)

	# print('================')
	# print("device:",device)
	# if device == 'cpu':
	# print("num_device: 1")
	# else:
	# print("num_device:", torch.cuda.device_count())
	# print('================')

	self.num_device = torch.cuda.device_count()

	self.batch_size = batch_size #//self.num_device
	self.img_pad_mode = img_pad_mode
	self.ddf_pad_mode = ddf_pad_mode
	self.padding_mode = padding_mode
	self.resample_mode = resample_mode
	self.image_chw = image_chw
	self.network = network#.to(self.device)
	self.ddf_stn_full = STN(
	img_sz = self.image_chw[1],
	ndims = self.ndims,
	padding_mode = self.padding_mode,
	device = self.device,
	)
	self._DDF_Encoder_init()
	self.copy_opt = nn.Identity()
	self.inf_mode = inf_mode
	return

	def get_stn(self):
	return self.img_stn, self.ddf_stn_full

	def _DDF_Encoder_init(self, ctl_ratio=4, ctl_sz=None, resample_mode=None):
	if ctl_sz is None:
	ctl_sz = self.image_chw[1] // ctl_ratio
	self.ctl_sz=ctl_sz
	self.img_sz=self.image_chw[1]
	self.ddf_stn_rec=STN(img_sz=ctl_sz,ndims=self.ndims,device=self.device,padding_mode=self.ddf_pad_mode)
	self.img_stn=STN(img_sz=self.img_sz,ndims=self.ndims,device=self.device,padding_mode=self.img_pad_mode,resample_mode=self.resample_mode)
	self.msk_stn=STN(img_sz=self.img_sz,ndims=self.ndims,device=self.device,padding_mode=self.img_pad_mode,resample_mode='nearest')

	def _get_ddf_scale(self,t,divide_num=1,max_ddf_num=200): # 128
	rec_num = 1
	mul_num_ddf = torch.floor_divide(2torch.pow(t,1.3), 3divide_num).int()
	mul_num_dvf = torch.floor_divide(torch.pow(t,0.6), divide_num).int()
	# print("time_step:",t,"mul_num_ddf:",mul_num_ddf,"mul_num_dvf:",mul_num_dvf)
	# mul_num_ddf = self._sample_random_uniform_multi_order(high=mul_num_ddf)
	# mul_num_dvf = self._sample_random_uniform_multi_order(high=mul_num_dvf)
	mul_num_ddf = torch.clamp(mul_num_ddf, min=1, max=max_ddf_num)
	mul_num_dvf = torch.clamp(mul_num_dvf, min=0, max=max_ddf_num)
	# print("time_step:",t,"mul_num_ddf:",mul_num_ddf,"mul_num_dvf:",mul_num_dvf)
	return rec_num,mul_num_ddf,mul_num_dvf

	# def _sample_random_uniform_multi_order(self, high=None, low=0, order_num=3):
	# # high: tensor of shape (...), low: int or tensor broadcastable to high
	# sample_num = torch.full_like(high, low) if not isinstance(low, torch.Tensor) else low.clone()
	# for _ in range(order_num):
	# # For each element, sample in [sample_num, high]
	# # torch.randint requires scalar low/high, so we use elementwise sampling
	# rand_shape = high.shape
	# # Clamp sample_num to be <= high
	# sample_num = torch.minimum(sample_num, high)
	# # Generate random numbers for each element
	# rand = torch.empty(rand_shape, dtype=high.dtype, device=high.device)
	# for idx in np.ndindex(rand_shape):
	# l = sample_num[idx].item()
	# h = high[idx].item()
	# if l >= h:
	# rand[idx] = l
	# else:
	# rand[idx] = torch.randint(l, h + 1, (1,), device=high.device)
	# sample_num = rand.to(high.dtype)
	# return sample_num

	def _get_random_ddf(self,img,t):
	rec_num, mul_num_ddf, mul_num_dvf = self._get_ddf_scale(t=t)
	ddf_forward,dvf_forward = self._random_ddf_generate(rec_num=rec_num, mul_num=[mul_num_ddf,mul_num_dvf])
	warped_img = self.img_stn(img,ddf_forward)
	return warped_img, dvf_forward,ddf_forward

	def _multiscale_dvf_generate(self,v_scale,ctl_szs=[4,8,16,32,64], rand_v_scale=True):
	dvf=0
	if self.img_sz is None:
	self.img_sz=max(ctl_szs)
	if 1 in ctl_szs:
	dvf_rot = utils.random_ddf(batch_size=self.batch_size, ndims=self.ndims, img_sz=[self.ctl_sz]*self.ndims, range_gauss=0, rot_range=np.pi/90)
	dvf = dvf + dvf_rot
	for ctl_sz in ctl_szs:
	_v_scale = self._sample_random_uniform_multi_order(high=v_scale, low=1e-8, order_num=2) if rand_v_scale else v_scale
	# temp>>
	if ctl_sz <= 2:
	_v_scale = _v_scale/2
	# temp<<
	dvf_comp = torch.randn([self.batch_size, self.ndims] + [ctl_sz]self.ndims) _v_scale
	dvf_comp = F.interpolate(dvf_comp * self.ctl_sz / ctl_sz, [self.ctl_sz]*self.ndims, align_corners=False, mode='bilinear' if self.ndims == 2 else 'trilinear')
	dvf=dvf+dvf_comp
	return dvf

	def _sample_random_uniform_multi_order(self, high=None, low=0., order_num=3):
	sample_value = low
	for _ in range(order_num):
	sample_value = np.random.uniform(low=sample_value, high=high)
	return sample_value

	def _random_ddf_generate(self,rec_num=3,mul_num=[torch.tensor([5]),torch.tensor([5])],ddf0=None,keep_inverse=False,noise_ratio=0.08,select_num=4, flip_ratio=0.5):
	crop_rate=2
	for _ in range(self.ndims+1):
	mul_num=[torch.unsqueeze(n,-1) for n in mul_num]
	# v_scale = v_scale *crop_rate
	ctl_ddf_sz=[self.batch_size, self.ndims] + [self.ctl_sz] * self.ndims
	if ddf0 is not None:
	ddf=ddf0
	else:
	ddf = torch.zeros(ctl_ddf_sz) * 0
	dddf = torch.zeros(ctl_ddf_sz) * 0
	scale_num = min(8,int(math.log2(self.ctl_sz))) # allow affine
	# scale_num = min(5,int(math.log2(self.ctl_sz))-1) # semi-allow affine
	# scale_num = min(5,int(math.log2(self.ctl_sz))-2) # avoid coupling between deformation and affine
	ctl_szs_all = [self.ctl_sz // (2 ** i) for i in range(scale_num)]

	for i in range(rec_num):
	# Randomly select 5 elements from ctl_szs (if there are at least 5)
	if len(ctl_szs_all) > select_num:
	ctl_szs = random.sample(ctl_szs_all, select_num)
	dvf = self._multiscale_dvf_generate(self.v_scale, ctl_szs=ctl_szs).to(self.device)
	# if True:
	if noise_ratio==0:
	dvf0=dvf
	else:
	dvf0=dvf+self.ddf_stn_rec(self._multiscale_dvf_generate(self.v_scale*noise_ratio,ctl_szs=ctl_szs, rand_v_scale=False).to(self.device),dvf)
	# print([num.shape for num in mul_num])
	for j in range(torch.max(mul_num[0]).item()):
	flag = [(n>j).int().to(self.device) for n in mul_num]
	ddf = dvf0flag[0] + self.ddf_stn_rec(ddf, dvf0flag[0])
	dddf = dvfflag[1] + self.ddf_stn_rec(dddf, dvfflag[1])

	ddf = F.interpolate(ddf * self.img_sz/self.ctl_sz, self.img_sz*crop_rate, mode='bilinear' if self.ndims == 2 else 'trilinear')
	# ddf = ddf[...,img_sz//2:img_sz3//2,img_sz//2:img_sz3//2]
	if self.ndims==2:
	ddf = ddf[..., self.img_sz // 2:self.img_sz * 3 // 2, self.img_sz // 2:self.img_sz * 3 // 2]
	else:
	ddf = ddf[..., self.img_sz // 2:self.img_sz * 3 // 2, self.img_sz // 2:self.img_sz * 3 // 2, self.img_sz // 2:self.img_sz * 3 // 2]
	# if rec_num==1:
	if True:
	dddf = F.interpolate(dddf * self.img_sz/self.ctl_sz, self.img_sz*crop_rate, mode='bilinear' if self.ndims == 2 else 'trilinear')
	# dddf = dddf[...,img_sz//2:img_sz3//2,img_sz//2:img_sz3//2]
	if self.ndims == 2:
	dddf = dddf[..., self.img_sz // 2:self.img_sz * 3 // 2, self.img_sz // 2:self.img_sz * 3 // 2]
	else:
	dddf = dddf[..., self.img_sz // 2:self.img_sz * 3 // 2, self.img_sz // 2:self.img_sz * 3 // 2, self.img_sz // 2:self.img_sz * 3 // 2]
	return ddf,dddf
	else:
	return ddf

	def create_noise_map(self, img, noise_type='gaussian', noise_scale=0.1):
	if noise_type == 'gaussian':
	noise_map = torch.randn_like(img) * noise_scale
	elif noise_type == 'uniform':
	noise_map = torch.rand_like(img)noise_scale2-noise_scale # 0-1
	elif noise_type == 'binary':
	noise_map = torch.bernoulli(torch.rand_like(img))
	else:
	noise_map = torch.zeros_like(img)
	noise_map = noise_map.to(img.device)
	return noise_map

	def add_noise(self, img, noise_map=None, noise_ratio_range=[0.,1.]):
	noise_ratio = np.random.uniform(noise_ratio_range[0], noise_ratio_range[1])
	return img * (1-noise_ratio) + noise_map * noise_ratio, noise_ratio

	def apply_noise(self, img, noise_map=None, apply_mask=None):
	return img * apply_mask + noise_map * (1-apply_mask)

	def downsample(self, img, down_ratio_range=[1./32,1]):
	down_ratio = list(np.random.uniform(down_ratio_range[0], down_ratio_range[1],[self.ndims]))
	# print(down_ratio)
	down_img = F.interpolate(img, scale_factor=down_ratio, mode='bilinear' if self.ndims == 2 else 'trilinear')
	# print(down_img)
	# return F.interpolate(down_img, size=[self.image_chw[1]]*self.ndims, mode='bilinear' if self.ndims == 2 else 'trilinear', align_corners=False), np.prod(down_ratio)
	return F.interpolate(down_img, size=[self.image_chw[1]]*self.ndims, mode='bilinear' if self.ndims == 2 else 'trilinear', align_corners=False), np.sqrt(np.prod(down_ratio)) # jzheng: cond weight based on entropy

	def get_slice_mask(self, img, slice_num_range=[0,32]):
	slice_num_range[1] = min(slice_num_range[1], self.image_chw[1])
	mask = torch.zeros_like(img)
	sample_ratio = 0
	for i in range(self.ndims):
	if self.inf_mode:
	slice_num = 1 # use max slice num for inference for better performance
	slice_idx = [self.image_chw[1]//2] # use middle slice for inference for better performance
	else:
	slice_num = random.randint(slice_num_range[0], slice_num_range[1])
	slice_idx = random.sample(range(self.image_chw[1]), slice_num)
	transpose_list = [0, 1, 1 + self.ndims] + list(range(2, 1 + self.ndims))
	for idx in slice_idx:
	mask[..., idx] = 1
	mask = mask.permute(*transpose_list)
	# sample_ratio += slice_num / self.image_chw[1] / self.ndims
	sample_ratio += np.sqrt(slice_num / self.image_chw[1]) / self.ndims # jzheng: cond weight based on entropy

	# print(mask)
	# print("sample_ratio:", sample_ratio)
	return mask, sample_ratio

	def project(self, img):
	proj_img = torch.zeros_like(img)
	rand_bourn = np.random.randint(0, 2, size=[self.ndims])
	proj_dim_num = np.sum(rand_bourn)
	for i,pflag in zip(range(2, 2 + self.ndims), rand_bourn):
	if pflag:
	proj_img += torch.mean(img, dim=i, keepdim=True)
	# print("projecting dim:", i)
	return proj_img/(proj_dim_num+EPS), proj_dim_num

	def proc_cond_img(self, img, proc_type=None,noise_scale=0.1):
	# Remove torch.no_grad() since most operations are not differentiable anyway
	proc_img = img.clone().detach()
	if proc_type is None:
	# Heavily bias towards 'uncon' for efficiency
	proc_type = random.choices(
	# ['adding', 'independ', 'downsample', 'slice', 'project', 'none', 'uncon'],
	# weights=[1, 1, 1, 1, 1, 1, 3], k=1
	['adding', 'independ', 'downsample', 'slice','slice1', 'none', 'uncon'],
	weights=[1, 1, 1, 1, 1, 3], k=1
	)[0]
	mask = torch.tensor(1, device=img.device)
	cond_ratio = torch.tensor(1., device=img.device)
	self.msk_noise_scale = torch.tensor(0, device=img.device)
	noise_type = random.choice(['gaussian', 'uniform', 'none'])
	# Precompute noise_map only if needed
	noise_map = None
	if proc_type not in ['none', None, '']:
	if proc_type == 'uncon':
	noise_map = self.create_noise_map(img, noise_type=noise_type,noise_scale=noise_scale)
	proc_img = noise_map
	mask = torch.tensor(0, device=img.device)
	cond_ratio = torch.tensor(0, device=img.device)
	return proc_img, mask, cond_ratio
	if proc_type in ['adding', 'independ', 'slice','slice1']:
	# self.msk_noise_scale = 0
	noise_map = self.create_noise_map(img, noise_type=noise_type,noise_scale=noise_scale)
	if proc_type == 'adding':
	proc_img, noise_ratio = self.add_noise(proc_img, noise_map=noise_map, noise_ratio_range=[0., 1.])
	cond_ratio = torch.tensor(1 - noise_ratio, device=img.device)
	elif proc_type == 'independ':
	mask = self.create_noise_map(img, noise_type='binary')
	if self.msk_noise_scale == 0:
	proc_img = img * mask
	else:
	proc_img = self.apply_noise(proc_img, noise_map=noise_map*self.msk_noise_scale, apply_mask=mask)
	with torch.no_grad():
	cond_ratio = mask.float().mean()
	elif proc_type == 'downsample':
	# proc_img, down_ratio = self.downsample(proc_img, down_ratio_range=[1./32, 1])
	proc_img, down_ratio = self.downsample(proc_img, down_ratio_range=[1./64, 1])
	cond_ratio = torch.tensor(down_ratio, device=img.device)
	elif proc_type == 'slice' or proc_type == 'slice1':
	if proc_type == 'slice1':
	slice_num_max = 1
	else:
	slice_num_max = random.randint(1, 64)
	slice_num_max = random.randint(1, slice_num_max)
	mask, sample_ratio = self.get_slice_mask(img, slice_num_range=[0, slice_num_max])
	if self.msk_noise_scale == 0:
	proc_img = img * mask
	else:
	proc_img = self.apply_noise(proc_img, noise_map=noise_map*self.msk_noise_scale, apply_mask=mask)
	cond_ratio = torch.tensor(sample_ratio, device=img.device)
	elif proc_type == 'project':
	proc_img, proj_num = self.project(proc_img)
	cond_ratio = torch.tensor(proj_num / (128 * self.ndims), device=img.device)
	# cond_ratio = torch.tensor(proj_num / (32 * self.ndims), device=img.device) # jzheng: cond weight based on entropy
	return proc_img, mask, cond_ratio

	def diffuse(self, x_0, t):
	t=torch.tensor(t)
	# img_t, dvf_forward, ddf_forward, ddf_stn, img_stn = self.ddf_enc(img= x_0, t=t)
	# return img_t, dvf_forward,ddf_forward,ddf_stn,img_stn
	return self._get_random_ddf(img = x_0, t = t)


	def recover(self, x, y, t,rec_num=2, text=None):
	if isinstance(t, list):
	t=[torch.tensor(t0) for t0 in t]
	t=[t0.to(x.device) for t0 in t]
	else:
	t=torch.tensor(t)
	t.to(x.device)
	if rec_num is None:
	rec_num = self.rec_num
	return self.network(x=x, y=y, t=t, rec_num=rec_num, text=text)

	def recover_frozen_params_but_grad_input(self, x, y, t,rec_num=2, text=None):
	"""
	use detach to recover:
	- but not include no_grad
	"""
	if isinstance(t, list):
	t = [torch.tensor(t0, device=x.device) for t0 in t]
	else:
	t = torch.tensor(t, device=x.device)

	if rec_num is None:
	rec_num = self.rec_num

	# params = {k: v.detach() for k, v in self.network.named_parameters()}
	# buffers = dict(self.network.named_buffers()) # BN running stats etc. buffer
	# # functional_call require position args，here kwargs doesnot work, so：
	# def _forward(module, kw):
	# return module(**kw)
	# # functional_call(module, ...) can only pass args/kwargs to module.forward
	# # PyTorch 2.x support functional_call(module, (params, buffers), args, kwargs)
	# return functional_call(
	# self.network,
	# (params, buffers),
	# args=(),
	# kwargs=dict(x=x, y=y, t=t, rec_num=rec_num, text=text),
	# )

	# 1) param detached
	params = {k: v.detach() for k, v in self.network.named_parameters()}
	# 2) buffers keeps unchanged
	buffers = dict(self.network.named_buffers())

	# 3) old version of PyTorch doesnot support passing params and buffers together
	params_and_buffers = {}
	params_and_buffers.update(params)
	params_and_buffers.update(buffers)
	return functional_call(
	self.network,
	params_and_buffers,
	(),
	kwargs=dict(x=x, y=y, t=t, rec_num=rec_num, text=text),
	)


	def _single_step(self, x0, t, rec_num=2, proc_type=None,mask=None, cond_imgs=None, text=None):
	if mask is None:
	mask = 1
	# org_imgs=self.copy_opt(x0)
	if cond_imgs is None:
	cond_imgs, mask_tgt, cond_ratio = self.proc_cond_img(x0,proc_type=proc_type)
	noisy_imgs, dvf_I,_ = self.diffuse(x0, t)
	if isinstance(self.network,DefRec_MutAttnNet):
	t = [t] * 1
	return self.recover(x=noisy_imgs*mask, y=cond_imgs, t=t, rec_num=rec_num, text=text), dvf_I

	def forward(self, img_org, cond_imgs=None, proc_type=None, T=None, **kwargs):
	if T is not None:
	return self.diff_recover(img_org=img_org, T=T, proc_type=proc_type, cond_imgs=cond_imgs, **kwargs)
	else:
	return self._single_step(x0=img_org, proc_type=proc_type, cond_imgs=cond_imgs, **kwargs)
	# if mask is None:
	# mask = 1
	# cond_imgs = self.proc_cond_img(x0, proc_type=proc_type, **kwargs)
	# noisy_imgs, dvf_I, _ = self.diffuse(x0, t)
	# if isinstance(self.network, DefRec_MutAttnNet):
	# t = [t] * 1
	# return self.recover(x=noisy_imgs * mask, y=cond_imgs, t=t, rec_num=rec_num), dvf_I

	def diff_recover(self,
	img_org,
	msk_org=None,
	T=[None,None],
	ddf_rand=None,
	v_scale = None,
	t_save=None,
	cond_imgs=None,
	proc_type=None,
	text=None,
	):
	if cond_imgs is None:
	cond_imgs = img_org.clone().detach()
	# if proc_type is not None:
	cond_imgs,mask_tgt,cond_ratio=self.proc_cond_img(cond_imgs, proc_type=proc_type)
	if ddf_rand is None:
	if v_scale is not None:
	self.v_scale=v_scale
	self._DDF_Encoder_init()
	if T[0] is None or T[0] == 0:
	img_diff = img_org.clone().detach()
	ddf_rand = torch.zeros_like(img_diff)
	else:
	img_diff, _, ddf_rand = self._get_random_ddf(img= img_org, t=torch.tensor(np.array([T[0]])).to(self.device))
	else:
	img_diff = self.img_stn(img_org.clone().detach(), ddf_rand)
	ddf_comp = ddf_rand.clone().detach()
	img_rec = img_diff.clone().detach()
	if msk_org is not None:
	msk_diff = self.msk_stn(msk_org.clone().detach(), ddf_rand)
	else:
	msk_diff = None
	msk_rec = msk_diff.clone().detach() if msk_org is not None else None
	img_save=[]
	msk_save=[]

	if isinstance(self.network,DefRec_MutAttnNet):
	# Denosing image via list of t
	t_list = list(range(T[1]-1, -1, -1))
	pre_dvf_I = self.recover(x=img_rec, y=cond_imgs, t=t_list,rec_num=None, text=text)
	ddf_comp = self.ddf_stn_full(ddf_comp, pre_dvf_I) + pre_dvf_I
	img_rec = self.img_stn(img_org.clone().detach(), ddf_comp)
	if msk_org is not None:
	msk_rec = self.msk_stn(msk_org.clone().detach(), ddf_comp)
	else:
	# Denosing image
	if isinstance(T[-1], int):
	time_steps = range(T[-1] - 1, -1, -1)
	trainable_iterations =[]
	else:
	time_steps = T[-1]

	# # Randomly select k iterations to make their parameters trainable
	# win_len = 2 # Number of iterations to make trainable
	# if len(time_steps) <= win_len:
	# win_start = 0
	# else:
	# win_start = random.randint(len(time_steps)//2, len(time_steps) - win_len)
	# win_end = win_start + win_len - 1

	k=2
	# trainable_iterations = time_steps[win_start: win_start + win_len]
	# trainable_iterations = random.sample(time_steps, k)
	trainable_iterations = time_steps[-1:-k-1:-1]
	# print(time_steps)
	# print("trainable_iterations:", trainable_iterations)
	for i in time_steps:
	t = torch.tensor(np.array([i])).to(self.device)

	if i in trainable_iterations:
	# Make parameters trainable for this iteration
	pre_dvf_I = self.recover(x=img_rec, y=cond_imgs, t=t, rec_num=None, text=text)
	else:
	# Freeze parameters for this iteration using torch.no_grad()
	with torch.no_grad():
	pre_dvf_I = self.recover(x=img_rec, y=cond_imgs, t=t, rec_num=None, text=text)
	# for idx, i in enumerate(time_steps):
	# t = torch.tensor(np.array([i])).to(self.device)
	# if idx < win_start:
	# # just no_grad
	# with torch.no_grad():
	# pre_dvf_I = self.recover(x=img_rec, y=cond_imgs, t=t, rec_num=None, text=text)
	# elif win_start <= idx <= win_end:
	# # normal update
	# pre_dvf_I = self.recover(x=img_rec, y=cond_imgs, t=t, rec_num=None, text=text)
	# else:
	# # freeze params but keep grad for input
	# pre_dvf_I = self.recover_frozen_params_but_grad_input(
	# x=img_rec, y=cond_imgs, t=t, rec_num=None, text=text
	# )

	ddf_comp = self.ddf_stn_full(ddf_comp, pre_dvf_I) + pre_dvf_I
	# Apply to image
	img_rec = self.img_stn(img_org.clone().detach(), ddf_comp)
	if msk_org is not None:
	msk_rec = self.msk_stn(msk_org.clone().detach(), ddf_comp)
	if t_save is not None:
	if i in t_save:
	img_save.append(img_rec)
	if msk_org is not None:
	msk_save.append(msk_rec)

	# for i in time_steps:
	# t = torch.tensor(np.array([i])).to(self.device)
	# pre_dvf_I = self.recover(x=img_rec, y=cond_imgs, t=t,rec_num=None)
	# ddf_comp = self.ddf_stn_full(ddf_comp, pre_dvf_I) + pre_dvf_I
	# # apply to image
	# img_rec = self.img_stn(img_org.clone().detach(), ddf_comp)
	# if msk_org is not None:
	# msk_rec = self.img_stn(msk_org.clone().detach(), ddf_comp)
	# if t_save is not None:
	# if i in t_save:
	# img_save.append(img_rec)
	# if msk_org is not None:
	# msk_save.append(msk_rec)
	# print(torch.max(torch.abs(ddf_comp)))
	# print(torch.max(torch.abs(ddf_rand)))

	return [ddf_comp,ddf_rand],[img_rec,img_diff,img_save],[msk_rec,msk_diff,msk_save]

	if __name__ == "__main__":
	H, W = 8, 8
	deformddpm = DeformDDPM(network=get_net(name="recmutattnnet")(n_steps=80, ndims=2, num_input_chn=1),image_chw=(1, H, W),device='cpu')
	# img = torch.zeros([1, 1, H, W])
	img = torch.randn([1, 1, H, W])
	t = 1
	rec_num = 2
	# proc_type = 'adding'
	# proc_type = 'independ'
	# proc_type = 'downsample'
	proc_type = 'slice'
	# proc_type = 'project'
	# proc_type = 'none'
	print(img)
	cond_imgs, mask_tgt = deformddpm.proc_cond_img(img, proc_type=proc_type)
	print(cond_imgs)
	# img_rec, dvf_I = deformddpm.forward(img, t, rec_num=rec_num, proc_type=proc_type)
	# print(img_rec.shape, dvf_I.shape)

	# proc_type = 'adding'
	# ddf_comp, ddf_rand = deformddpm.diff_recover(img, T=[1,1], proc_type=proc_type)