论文复现丨基于ModelArts进行图像风格化绘画

摘要：这个 notebook 基于论文「Stylized Neural Painting, arXiv:2011.08114.」提供了最基本的「图片生成绘画」变换的可复现例子。

本文分享自华为云社区《基于ModelArts进行图像风格化绘画》，作者： HWCloudAI 。

ModelArts 项目地址：https://developer.huaweicloud.com/develop/aigallery/notebook/detail?id=b4e4c533-e0e7-4167-94d0-4d38b9bcfd63

下载代码和模型

import os

import moxing as mox

mox.file.copy('obs://obs-aigallery-zc/clf/code/stylized-neural-painting.zip','stylized-neural-painting.zip')

os.system('unzip stylized-neural-painting.zip')

cd stylized-neural-painting

import argparse

import torch

torch.cuda.current_device()

import torch.optim as optim

from painter import *

# 检测运行设备

device = torch.device("cuda:0" if torch.cuda.is_available() else "cpu")

# 配置

parser = argparse.ArgumentParser(description='STYLIZED NEURAL PAINTING')

args = parser.parse_args(args=[])

args.img_path = './test_images/sunflowers.jpg' # 输入图片路径

args.renderer = 'oilpaintbrush' # 渲染器（水彩、马克笔、油画笔刷、矩形） [watercolor, markerpen, oilpaintbrush, rectangle]

args.canvas_color = 'black' # 画布底色 [black, white]

args.canvas_size = 512 # 画布渲染尺寸，单位像素

args.max_m_strokes = 500 # 最大笔划数量

args.m_grid = 5 # 将图片分割为 m_grid x m_grid 的尺寸

args.beta_L1 = 1.0 # L1 loss 权重

args.with_ot_loss = False # 设为 True 以通过 optimal transportation loss 提高收敛。但会降低生成速度

args.beta_ot = 0.1 # optimal transportation loss 权重

args.net_G = 'zou-fusion-net' # 渲染器架构

args.renderer_checkpoint_dir = './checkpoints_G_oilpaintbrush' # 预训练模型路径

args.lr = 0.005 # 笔划搜寻的学习率

args.output_dir = './output' # 输出路径

Download pretrained neural renderer.

Define a helper funtion to check the drawing status.

def _drawing_step_states(pt):

    acc = pt._compute_acc().item()

    print('iteration step %d, G_loss: %.5f, step_psnr: %.5f, strokes: %d / %d'

          % (pt.step_id, pt.G_loss.item(), acc,

              (pt.anchor_id+1)*pt.m_grid*pt.m_grid,

              pt.max_m_strokes))

    vis2 = utils.patches2img(pt.G_final_pred_canvas, pt.m_grid).clip(min=0, max=1)

定义优化循环

def optimize_x(pt):

    pt._load_checkpoint()

    pt.net_G.eval()

    pt.initialize_params()

    pt.x_ctt.requires_grad = True

    pt.x_color.requires_grad = True

    pt.x_alpha.requires_grad = True

    utils.set_requires_grad(pt.net_G, False)

    pt.optimizer_x = optim.RMSprop([pt.x_ctt, pt.x_color, pt.x_alpha], lr=pt.lr)

    print('begin to draw...')

    pt.step_id = 0

    for pt.anchor_id in range(0, pt.m_strokes_per_block):

        pt.stroke_sampler(pt.anchor_id)

        iters_per_stroke = 20

        if pt.anchor_id == pt.m_strokes_per_block - 1:

            iters_per_stroke = 40

        for i in range(iters_per_stroke):

            pt.optimizer_x.zero_grad()

            pt.x_ctt.data = torch.clamp(pt.x_ctt.data, 0.1, 1 - 0.1)

            pt.x_color.data = torch.clamp(pt.x_color.data, 0, 1)

            pt.x_alpha.data = torch.clamp(pt.x_alpha.data, 0, 1)

            if args.canvas_color == 'white':

                pt.G_pred_canvas = torch.ones([args.m_grid ** 2, 3, 128, 128]).to(device)

            else:

                pt.G_pred_canvas = torch.zeros(args.m_grid ** 2, 3, 128, 128).to(device)

            pt._forward_pass()

            _drawing_step_states(pt)

            pt._backward_x()

            pt.optimizer_x.step()

            pt.x_ctt.data = torch.clamp(pt.x_ctt.data, 0.1, 1 - 0.1)

            pt.x_color.data = torch.clamp(pt.x_color.data, 0, 1)

            pt.x_alpha.data = torch.clamp(pt.x_alpha.data, 0, 1)

            pt.step_id += 1

    v = pt.x.detach().cpu().numpy()

    pt._save_stroke_params(v)

    v_n = pt._normalize_strokes(pt.x)

    pt.final_rendered_images = pt._render_on_grids(v_n)

    pt._save_rendered_images()

处理图片，可能需要一些时间，建议使用 32 GB+ 显存

pt = Painter(args=args)

optimize_x(pt)

Check out your results at args.output_dir. Before you download that folder, let’s first have a look at what the generated painting looks like.

plt.subplot(1,2,1)

plt.imshow(pt.img_), plt.title('input')

plt.subplot(1,2,2)

plt.imshow(pt.final_rendered_images[-1]), plt.title('generated')

plt.show()

请下载 args.output_dir 目录到本地查看高分辨率的生成结果/

# 将渲染进度用动交互画形式展现

import matplotlib.animation as animation

from IPython.display import HTML

fig = plt.figure(figsize=(4,4))

plt.axis('off')

ims = [[plt.imshow(img, animated=True)] for img in pt.final_rendered_images[::10]]

ani = animation.ArtistAnimation(fig, ims, interval=50)

# HTML(ani.to_jshtml())

HTML(ani.to_html5_video())

Next, let’s play style-transfer. Since we frame our stroke prediction under a parameter searching paradigm, our method naturally fits the neural style transfer framework.

接下来，让我们尝试风格迁移，由于我们是在参数搜索范式下构建的笔画预测，因此我们的方法自然的适用于神经风格迁移框架

# 配置

args.content_img_path = './test_images/sunflowers.jpg' # 输入图片的路径（原始的输入图片）

args.style_img_path = './style_images/fire.jpg' # 风格图片路径

args.vector_file = './output/sunflowers_strokes.npz' # 预生成笔划向量文件的路径

args.transfer_mode = 1 # 风格迁移模式，0：颜色迁移，1：迁移颜色和纹理

args.beta_L1 = 1.0 # L1 loss 权重

args.beta_sty = 0.5 # vgg style loss 权重

args.net_G = 'zou-fusion-net' # 渲染器架构

args.renderer_checkpoint_dir = './checkpoints_G_oilpaintbrush' # 预训练模型路径

args.lr = 0.005 # 笔划搜寻的学习率

args.output_dir = './output' # 输出路径

Again, Let’s define a helper funtion to check the style transfer status.

def _style_transfer_step_states(pt):

      acc = pt._compute_acc().item()

      print('running style transfer... iteration step %d, G_loss: %.5f, step_psnr: %.5f'

            % (pt.step_id, pt.G_loss.item(), acc))

      vis2 = utils.patches2img(pt.G_final_pred_canvas, pt.m_grid).clip(min=0, max=1)

定义优化循环

def optimize_x(pt):

    pt._load_checkpoint()

    pt.net_G.eval()

    if args.transfer_mode == 0: # transfer color only

        pt.x_ctt.requires_grad = False

        pt.x_color.requires_grad = True

        pt.x_alpha.requires_grad = False

    else: # transfer both color and texture

        pt.x_ctt.requires_grad = True

        pt.x_color.requires_grad = True

        pt.x_alpha.requires_grad = True

    pt.optimizer_x_sty = optim.RMSprop([pt.x_ctt, pt.x_color, pt.x_alpha], lr=pt.lr)

    iters_per_stroke = 100

    for i in range(iters_per_stroke):

        pt.optimizer_x_sty.zero_grad()

        pt.x_ctt.data = torch.clamp(pt.x_ctt.data, 0.1, 1 - 0.1)

        pt.x_color.data = torch.clamp(pt.x_color.data, 0, 1)

        pt.x_alpha.data = torch.clamp(pt.x_alpha.data, 0, 1)

        if args.canvas_color == 'white':

            pt.G_pred_canvas = torch.ones([pt.m_grid*pt.m_grid, 3, 128, 128]).to(device)

        else:

            pt.G_pred_canvas = torch.zeros(pt.m_grid*pt.m_grid, 3, 128, 128).to(device)

        pt._forward_pass()

        _style_transfer_step_states(pt)

        pt._backward_x_sty()

        pt.optimizer_x_sty.step()

        pt.x_ctt.data = torch.clamp(pt.x_ctt.data, 0.1, 1 - 0.1)

        pt.x_color.data = torch.clamp(pt.x_color.data, 0, 1)

        pt.x_alpha.data = torch.clamp(pt.x_alpha.data, 0, 1)

        pt.step_id += 1

    print('saving style transfer result...')

    v_n = pt._normalize_strokes(pt.x)

    pt.final_rendered_images = pt._render_on_grids(v_n)

    file_dir = os.path.join(

        args.output_dir, args.content_img_path.split('/')[-1][:-4])

    plt.imsave(file_dir + '_style_img_' +

               args.style_img_path.split('/')[-1][:-4] + '.png', pt.style_img_)

    plt.imsave(file_dir + '_style_transfer_' +

               args.style_img_path.split('/')[-1][:-4] + '.png', pt.final_rendered_images[-1])

运行风格迁移

pt = NeuralStyleTransfer(args=args)

optimize_x(pt)

高分辨率生成文件保存在 args.output_dir。

让我们预览一下输出结果：

plt.subplot(1,3,1)

plt.imshow(pt.img_), plt.title('input')

plt.subplot(1,3,2)

plt.imshow(pt.style_img_), plt.title('style')

plt.subplot(1,3,3)

plt.imshow(pt.final_rendered_images[-1]), plt.title('generated')

plt.show()

点击关注，第一时间了解华为云新鲜技术~

论文复现丨基于ModelArts进行图像风格化绘画的更多相关文章

实践案例丨基于ModelArts AI市场算法MobileNet_v2实现花卉分类
概述 MobileNetsV2是基于一个流线型的架构,它使用深度可分离的卷积来构建轻量级的深层神经网,此模型基于 MobileNetV2: Inverted Residuals and Linear ...
论文解读丨基于局部特征保留的图卷积神经网络架构(LPD-GCN)
摘要:本文提出一种基于局部特征保留的图卷积网络架构,与最新的对比算法相比,该方法在多个数据集上的图分类性能得到大幅度提升,泛化性能也得到了改善. 本文分享自华为云社区<论文解读:基于局部特征保留 ...
Python图像处理丨基于OpenCV和像素处理的图像灰度化处理
摘要:本篇文章讲解图像灰度化处理的知识,结合OpenCV调用cv2.cvtColor()函数实现图像灰度操作,使用像素处理方法对图像进行灰度化处理. 本文分享自华为云社区<[Python图像处理 ...
Visualizing and Understanding Convolutional Networks论文复现笔记
目录 Visualizing and Understanding Convolutional Networks 论文复现笔记 Abstract Introduction Approach Visual ...
FCOS论文复现：通用物体检测算法
摘要:本案例代码是FCOS论文复现的体验案例,此模型为FCOS论文中所提出算法在ModelArts + PyTorch框架下的实现.本代码支持FCOS + ResNet-101在MS-COCO数据集上 ...
笔记：基于DCNN的图像语义分割综述
写在前面:一篇魏云超博士的综述论文,完整题目为<基于DCNN的图像语义分割综述>,在这里选择性摘抄和理解,以加深自己印象,同时达到对近年来图像语义分割历史学习和了解的目的,博古才能通今!感 ...
Demo分享丨看ModelArts与HiLens是如何让车自己跑起来的
摘要:基于HiLens Kit已经基本开发完成,可部署到HiLens Kit,模型的选择为基于DarkNet53的YOLOv3模型,权重为基于COCO2014训练的数据集,而车道线的检测是基于Open ...
昇腾CANN论文上榜CVPR，全景图像生成算法交互性再增强！
摘要:近日,CVPR 2022放榜,基于CANN的AI论文<Interactive Image Synthesis with Panoptic Layout Generation>强势上榜 ...
Split to Be Slim: 论文复现
摘要:在本论文中揭示了这样一种现象:一层内的许多特征图共享相似但不相同的模式. 本文分享自华为云社区<Split to Be Slim: 论文复现>,作者: 李长安 . Split to ...
基于clahe的图像去雾
基于clahe的图像去雾通过阅读一些资料,我了解到clahe算法对图像去雾有所价值,正好opencv中有了实现,拿过来看一看. 但是现在实现的效果还是有所差异 #); clahe] ...

随机推荐

[ABC204E] Rush Hour 2 题解
Rush Hour 2 题目大意给定一张无向图,边带两个参数 \(c_i,d_i\),在 \(t\) 时间时经过第 \(i\) 条边所需的时间是 \(c_i+\lfloor\frac{d_i}{t+ ...
zend framework 数据库操作（DB操作）总结
(1)数据查询总结 fetchRow()这个方法返回一行,具体返回是相关数组还是什么用setFetchMode()决定fetchCol()返回第一列fetchOne()返回第一行,第一列.为一个值不是 ...
Redis主从复制部署小结
Redis主从搭建主从架构单节点Redis的并发能力是有上限的,要进一步提高Redis的并发能力,就需要搭建主从集群,实现读写分离. 主从数据同步原理全量同步主从第一次建立连接时,会执行全量同 ...
Chromium 消息循环和线程池详解
Chromium 中的多线程机制由 base 库提供,要理解 Chromium 中的多线程机制,首先要理解的概念就是 base::MessageLoop 和 base::TaskScheduler , ...
Go开发IDE全览：GoLand vs VSCode全面解析
关注[TechLeadCloud],分享互联网架构.云服务技术的全维度知识.作者拥有10+年互联网服务架构.AI产品研发经验.团队管理经验,同济本复旦硕,复旦机器人智能实验室成员,阿里云认证的资深架构 ...
vue中数字和字符串的转换问题（v-bind和v-model的使用）
可以看到上面自增加时,成了拼接字符串的效果. 打开vue工具查看: 此时n和sum都是数字,可以正常自增加,但是操作了section之后,n就变成了字符串: 此时再执行自增加,sum也会变成字符串形式 ...
C#_TCPClient异步连接和接收消息
//c#不愧是全能型的语言,异步连线程都省了 class State { public byte[] bufferCache; public TcpClient tcpClient; } ... pr ...
Java模块化应用实践之精简JRE（内含开源）
导语 Java9及以后的版本引入了模块化特性,但是直到今天JDK21都发布了,依然没有被大量使用起来,那么这个特性就真的没啥意义了吗? 别忘了,Java本身可是把模块化做到了极致的,所以可以利用这个特 ...
Apollo 配置中心的部署与使用经验
前言 Apollo(阿波罗)是携程开源的分布式配置管理中心. 本文主要介绍其基于 Docker-Compose 的部署安装和一些使用的经验特点成熟,稳定支持管理多环境/多集群/多命名空间的配置 ...
Java8新特性(Lambda表达式、Stream流、Optional类)等
1. Lambda表达式由来 1 package java8; 2 3 public class EmployeeTest { 4 public static void main(String[] a ...

论文复现丨基于ModelArts进行图像风格化绘画

下载代码和模型

论文复现丨基于ModelArts进行图像风格化绘画的更多相关文章

随机推荐

热门专题