基于Python制作圖像完美超分處理工具
前言
根據(jù)上一篇文章:Python圖片視頻超分模型RealBasicVSR的使用教程
我把項目進行的工具化調(diào)整,做成了對單一照片輸入進行處理的工具。大家可以拿去直接集成到代碼中使用。
github項目地址:工具項目地址
項目說明
項目結(jié)構(gòu)如下
注意項
1、 checkpoints中的模型文件太大,上傳不到github上,大家可以通過下面我分享的百度云盤地址下載,放到checkpoints目錄中。
鏈接 提取碼:1234
2、conda環(huán)境安裝,我這里就不多敘述了,直接參考上一篇文章中的安裝過程即可。
Python圖片視頻超分模型RealBasicVSR的使用教程
代碼說明
主要的核心代碼是inference_hy.py文件,代碼如下:
#!/user/bin/env python # coding=utf-8 """ @project : hy_realbasicvsr @author : 劍客阿良_ALiang @file : inference_hy.py @ide : PyCharm @time : 2022-05-08 15:18:15 """ import argparse import glob import os import cv2 import mmcv import numpy as np import torch import uuid from mmcv.runner import load_checkpoint from mmedit.core import tensor2img from realbasicvsr.models.builder import build_model def init_model(config, checkpoint=None): if isinstance(config, str): config = mmcv.Config.fromfile(config) elif not isinstance(config, mmcv.Config): raise TypeError('config must be a filename or Config object, ' f'but got {type(config)}') config.model.pretrained = None config.test_cfg.metrics = None model = build_model(config.model, test_cfg=config.test_cfg) if checkpoint is not None: checkpoint = load_checkpoint(model, checkpoint) model.cfg = config # save the config in the model for convenience model.eval() return model class Worker: def __init__(self): self.checkpoint_path = 'checkpoints/RealBasicVSR_x4.pth' self.config = 'configs/realbasicvsr_x4.py' self.is_save_as_png = True self.max_seq_len = 2 self.model = init_model(self.config, self.checkpoint_path) def do_pic(self, input_image_path: str, output_dir: str): inputs = [] img = mmcv.imread(input_image_path, channel_order='rgb') ext = os.path.basename(input_image_path).split('.')[-1] inputs.append(img) for i, img in enumerate(inputs): img = torch.from_numpy(img / 255.).permute(2, 0, 1).float() inputs[i] = img.unsqueeze(0) inputs = torch.stack(inputs, dim=1) # map to cuda, if available cuda_flag = False if torch.cuda.is_available(): model = self.model.cuda() cuda_flag = True with torch.no_grad(): if isinstance(self.max_seq_len, int): outputs = [] for i in range(0, inputs.size(1), self.max_seq_len): imgs = inputs[:, i:i + self.max_seq_len, :, :, :] if cuda_flag: imgs = imgs.cuda() outputs.append(self.model(imgs, test_mode=True)['output'].cpu()) outputs = torch.cat(outputs, dim=1) else: if cuda_flag: inputs = inputs.cuda() outputs = self.model(inputs, test_mode=True)['output'].cpu() mmcv.mkdir_or_exist(output_dir) for i in range(0, outputs.size(1)): output = tensor2img(outputs[:, i, :, :, :]) filename = '{}.{}'.format(uuid.uuid1().hex, ext) if self.is_save_as_png: file_extension = os.path.splitext(filename)[1] filename = filename.replace(file_extension, '.png') result_path = os.path.join(output_dir, filename) mmcv.imwrite(output, result_path) if __name__ == '__main__': worker = Worker() worker.do_pic('data/136.jpeg', 'results/')
代碼說明
1、如果在真實項目中使用的話,worker對象可以在項目啟動中創(chuàng)建,不需要每次調(diào)用時候創(chuàng)建。
2、主要使用方法為do_pic方法,入?yún)⒎謩e為:需要超分的照片地址,以及最后生成的目錄地址。
3、最終輸出的照片名使用uuid進行命名,如果需要自定義的話,可以看著調(diào)整。
4、輸出的文件格式不一定需要是png,上面的類初始化有bool選項,自行調(diào)整。
測試一下代碼,先看一下圖片。
執(zhí)行結(jié)果
2022-05-08 15:47:54,792 - mmedit - INFO - load checkpoint from torchvision path: torchvision://vgg19
load checkpoint from local path: checkpoints/RealBasicVSR_x4.pth
/home/zhangmaolin/.local/lib/python3.7/site-packages/torch/functional.py:445: UserWarning: torch.meshgrid: in an upcoming release, it will be required to pass the indexing argument. (Triggered internally at ../aten/src/ATen/native/TensorShape.cpp:2157.)
return _VF.meshgrid(tensors, **kwargs) # type: ignore[attr-defined]
最終圖片輸出
總結(jié)
本文主要是造個輪子吧,相信有經(jīng)驗的可以自己改造,包括視頻處理也可以不要使用作者的demo,自己優(yōu)化一下邏輯,性能應(yīng)該都跟得上。提供思路吧,視頻拆分圖片組和音頻,處理完之后壓縮為一個視頻。
以上就是基于Python制作圖像完美超分處理工具的詳細內(nèi)容,更多關(guān)于Python圖像超分處理的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Python內(nèi)存泄漏和內(nèi)存溢出的解決方案
這篇文章主要介紹了Python內(nèi)存泄漏和內(nèi)存溢出的解決方案,幫助大家維護后臺進程,感興趣的朋友可以了解下2020-09-09python啟動辦公軟件進程(word、excel、ppt、以及wps的et、wps、wpp)
見如下源代碼,也可從附件中下載。2009-04-04