expansionnet-v2/utils/saving_utils.py


import os
import torch
from datetime import datetime

from torch.nn.parameter import Parameter

def load_most_recent_checkpoint(model,
                                optimizer=None,
                                scheduler=None,
                                data_loader=None,
                                rank=0,
                                save_model_path='./', datetime_format='%Y-%m-%d-%H:%M:%S',
                                verbose=True):
    ls_files = os.listdir(save_model_path)
    most_recent_checkpoint_datetime = None
    most_recent_checkpoint_filename = None
    most_recent_checkpoint_info = 'no_additional_info'
    for file_name in ls_files:
        if file_name.startswith('checkpoint_'):
            _, datetime_str, _, info, _ = file_name.split('_')
            file_datetime = datetime.strptime(datetime_str, datetime_format)
            if (most_recent_checkpoint_datetime is None) or \
                    (most_recent_checkpoint_datetime is not None and
                     file_datetime > most_recent_checkpoint_datetime):
                most_recent_checkpoint_datetime = file_datetime
                most_recent_checkpoint_filename = file_name
                most_recent_checkpoint_info = info

    if most_recent_checkpoint_filename is not None:
        if verbose:
            print("Loading: " + str(save_model_path + most_recent_checkpoint_filename))
        map_location = {'cuda:%d' % 0: 'cuda:%d' % rank}
        checkpoint = torch.load(save_model_path + most_recent_checkpoint_filename,
                                map_location=map_location)
        model.load_state_dict(checkpoint['model_state_dict'])
        if optimizer is not None:
            optimizer.load_state_dict(checkpoint['optimizer_state_dict'])
        if scheduler is not None:
            scheduler.load_state_dict(checkpoint['scheduler_state_dict'])
        if data_loader is not None:
            data_loader.load_state(checkpoint['data_loader_state_dict'])
        return True, most_recent_checkpoint_info
    else:
        if verbose:
            print("Loading: no checkpoint found in " + str(save_model_path))
        return False, most_recent_checkpoint_info


def save_last_checkpoint(model,
                         optimizer,
                         scheduler,
                         data_loader,
                         save_model_path='./',
                         num_max_checkpoints=3, datetime_format='%Y-%m-%d-%H:%M:%S',
                         additional_info='noinfo',
                         verbose=True):

    checkpoint = {
        'model_state_dict': model.state_dict(),
        'optimizer_state_dict': optimizer.state_dict(),
        'scheduler_state_dict': scheduler.state_dict(),
        'data_loader_state_dict': data_loader.save_state(),
    }

    ls_files = os.listdir(save_model_path)
    oldest_checkpoint_datetime = None
    oldest_checkpoint_filename = None
    num_check_points = 0
    for file_name in ls_files:
        if file_name.startswith('checkpoint_'):
            num_check_points += 1
            _, datetime_str, _, _, _ = file_name.split('_')
            file_datetime = datetime.strptime(datetime_str, datetime_format)
            if (oldest_checkpoint_datetime is None) or \
                    (oldest_checkpoint_datetime is not None and file_datetime < oldest_checkpoint_datetime):
                oldest_checkpoint_datetime = file_datetime
                oldest_checkpoint_filename = file_name

    if oldest_checkpoint_filename is not None and num_check_points == num_max_checkpoints:
        os.remove(save_model_path + oldest_checkpoint_filename)

    new_checkpoint_filename = 'checkpoint_' + datetime.now().strftime(datetime_format) + \
                              '_epoch' + str(data_loader.get_epoch_it()) + \
                              'it' + str(data_loader.get_batch_it()) + \
                              'bs' + str(data_loader.get_batch_size()) + \
                              '_' + str(additional_info) + '_.pth'
    if verbose:
        print("Saved to " + str(new_checkpoint_filename))
    torch.save(checkpoint, save_model_path + new_checkpoint_filename)


def partially_load_state_dict(model, state_dict, verbose=False):
    own_state = model.state_dict()
    num_print = 5
    count_print = 0
    for name, param in state_dict.items():
        if name not in own_state:
            if verbose:
                print("Not found: " + str(name))
            continue
        if isinstance(param, Parameter):
            param = param.data
        own_state[name].copy_(param)
        if verbose:
            if count_print < num_print:
                print("Found: " + str(name))
                count_print += 1
update the operator. Signed-off-by: wxywb <xy.wang@zilliz.com> 2 years ago
			`import os`
			`import torch`
			`from datetime import datetime`

			`from torch.nn.parameter import Parameter`

			`def load_most_recent_checkpoint(model,`
			`optimizer=None,`
			`scheduler=None,`
			`data_loader=None,`
			`rank=0,`
			`save_model_path='./', datetime_format='%Y-%m-%d-%H:%M:%S',`
			`verbose=True):`
			`ls_files = os.listdir(save_model_path)`
			`most_recent_checkpoint_datetime = None`
			`most_recent_checkpoint_filename = None`
			`most_recent_checkpoint_info = 'no_additional_info'`
			`for file_name in ls_files:`
			`if file_name.startswith('checkpoint_'):`
			`_, datetime_str, _, info, _ = file_name.split('_')`
			`file_datetime = datetime.strptime(datetime_str, datetime_format)`
			`if (most_recent_checkpoint_datetime is None) or \`
			`(most_recent_checkpoint_datetime is not None and`
			`file_datetime > most_recent_checkpoint_datetime):`
			`most_recent_checkpoint_datetime = file_datetime`
			`most_recent_checkpoint_filename = file_name`
			`most_recent_checkpoint_info = info`

			`if most_recent_checkpoint_filename is not None:`
			`if verbose:`
			`print("Loading: " + str(save_model_path + most_recent_checkpoint_filename))`
			`map_location = {'cuda:%d' % 0: 'cuda:%d' % rank}`
			`checkpoint = torch.load(save_model_path + most_recent_checkpoint_filename,`
			`map_location=map_location)`
			`model.load_state_dict(checkpoint['model_state_dict'])`
			`if optimizer is not None:`
			`optimizer.load_state_dict(checkpoint['optimizer_state_dict'])`
			`if scheduler is not None:`
			`scheduler.load_state_dict(checkpoint['scheduler_state_dict'])`
			`if data_loader is not None:`
			`data_loader.load_state(checkpoint['data_loader_state_dict'])`
			`return True, most_recent_checkpoint_info`
			`else:`
			`if verbose:`
			`print("Loading: no checkpoint found in " + str(save_model_path))`
			`return False, most_recent_checkpoint_info`


			`def save_last_checkpoint(model,`
			`optimizer,`
			`scheduler,`
			`data_loader,`
			`save_model_path='./',`
			`num_max_checkpoints=3, datetime_format='%Y-%m-%d-%H:%M:%S',`
			`additional_info='noinfo',`
			`verbose=True):`

			`checkpoint = {`
			`'model_state_dict': model.state_dict(),`
			`'optimizer_state_dict': optimizer.state_dict(),`
			`'scheduler_state_dict': scheduler.state_dict(),`
			`'data_loader_state_dict': data_loader.save_state(),`
			`}`

			`ls_files = os.listdir(save_model_path)`
			`oldest_checkpoint_datetime = None`
			`oldest_checkpoint_filename = None`
			`num_check_points = 0`
			`for file_name in ls_files:`
			`if file_name.startswith('checkpoint_'):`
			`num_check_points += 1`
			`_, datetime_str, _, _, _ = file_name.split('_')`
			`file_datetime = datetime.strptime(datetime_str, datetime_format)`
			`if (oldest_checkpoint_datetime is None) or \`
			`(oldest_checkpoint_datetime is not None and file_datetime < oldest_checkpoint_datetime):`
			`oldest_checkpoint_datetime = file_datetime`
			`oldest_checkpoint_filename = file_name`

			`if oldest_checkpoint_filename is not None and num_check_points == num_max_checkpoints:`
			`os.remove(save_model_path + oldest_checkpoint_filename)`

			`new_checkpoint_filename = 'checkpoint_' + datetime.now().strftime(datetime_format) + \`
			`'_epoch' + str(data_loader.get_epoch_it()) + \`
			`'it' + str(data_loader.get_batch_it()) + \`
			`'bs' + str(data_loader.get_batch_size()) + \`
			`'_' + str(additional_info) + '_.pth'`
			`if verbose:`
			`print("Saved to " + str(new_checkpoint_filename))`
			`torch.save(checkpoint, save_model_path + new_checkpoint_filename)`


			`def partially_load_state_dict(model, state_dict, verbose=False):`
			`own_state = model.state_dict()`
			`num_print = 5`
			`count_print = 0`
			`for name, param in state_dict.items():`
			`if name not in own_state:`
			`if verbose:`
			`print("Not found: " + str(name))`
			`continue`
			`if isinstance(param, Parameter):`
			`param = param.data`
			`own_state[name].copy_(param)`
			`if verbose:`
			`if count_print < num_print:`
			`print("Found: " + str(name))`
			`count_print += 1`