作者:韩信子@ShowMeAI

深度学习实战系列https://www.showmeai.tech/tutorials/42

本文地址https://www.showmeai.tech/article-detail/413

声明:版权所有,转载请联系平台与作者并注明出处

收藏ShowMeAI查看更多精彩内容

引言

人工智能图像生成器现在风靡一时。虽然 Dall-E2MidJourneyStable Diffusion目前处于中心舞台,但是百度开发的开源 AI 图像生成器 ERNIE-ViLG 也在互联网上流传。

ERNIE-ViLG 是什么

ERNIE 代表通过知识整合增强表示——视觉语言生成。它是一个统一的生成预训练框架,用于使用 Transformer 模型进行双向图像文本生成。

需要明确的是,ERNIE 并不是 Stable Duffusion 的一个变体版本,尽管这两种模型都是开源的。根据 ERNIE论文,ERNIE-ViLG 2.0 是一种改进的文本到图像扩散模型,具有知识增强的去噪专家组合,以结合有关视觉场景的额外知识,并在不同步骤中解耦去噪能力。

ERNIE-ViLG 使用方法

现在可以通过 huggingface 免费访问该模型。我们可以在 ERNIE-ViLG Demo 查看工具实例。

界面非常简单:可以看到经典的提示框,各种艺术风格的选择,以及图像分辨率。在艺术风格方面,ERNIE 提供了一些有趣的选择。这让我想起了 Dream by WOMBO 中的一个类似功能。

让我们用提示“An astronaut riding a horse in space”来生成样本。

该应用程序生成六张分辨率为 1024x1024 的图像。

ERNIE 的研究人员声称,他们的方法比 Dall-E2 和 Stable Diffusion 产生更清晰、更自然的细节。

真的吗?现在让我们尝试将艺术风格更改为“油画”。

这些结果本身都非常惊艳。

质量上,ERNIE 可以与 Dall-E2 和 Stable Diffusion 相媲美。但是,它在一致性方面表现不佳,就像在上面提到的,其中两个结果中的马无处可寻。这可能是训练ERNIE的数据集较小所致。

不过,如果仔细考虑数据集的大小,训练了 14.5 亿张图像的 ERNIE 与 MidJourney、Google Parti 等大型竞争对手的差距并不大。

也许开发人员找到了一种优化算法的方法,使其能够在较小的数据集上运行良好。我假设如果模型是在更大的数据集上训练的,现有的限制就会消失。

需要特别注意的是,ERNIE 是用中文开发的。这意味着,在开始图像生成过程之前,必须将英文提示翻译成中文。当然,使用中文的宝宝可以尽情玩耍~

这里有更多示例结果。

上图提示文字:“戴眼镜的猫”风格“油画”

上图提示文字:“五官端正的绘画女生”

API 访问 ERNIE-ViLG

您可以通过 API 访问 ERNIE。如果您想尝试使用 API,请按照这个 GitHub 上的指南进行操作。

示例 API 调用如下所示。

def generate_image(
text_prompts:str,
style: Optional[str] = "探索无限",
topk: Optional[int] = 6,
output_dir: Optional[str] = 'ernievilg_output')
  • text_prompts:输入提示
  • style :生成图像的风格
  • topk:生成图像的数量(最多 6 个)
  • output_dir:保存输出图像的目录

ERNIE 的使用指南还有一个建议列表,可帮助您找到结合使用样式和修饰符的最佳方式。

  • 【作图规则】Prompt构建是文本符合逻辑的组合,有序且丰富的描述可以不断提升画面效果
  • 【新手入门】不知如何输入Prompt?点击示例,体验文生图的魅力,参考教程,逐步进阶~
  • 【风格生成】试试添加 “国潮”、“国风”等,感受中国风的魅力
  • 【风格生成】试试混合两种代表性的风格,例如“赛博朋克,扁平化设计”、”皮克斯动画,赛博朋克”
  • 【人像生成】添加“仙鹤、月亮、楼阁、小屋、街道、玫瑰、机械”,画面会更饱满
  • 【人像生成】添加“精致面容、唯美、cg感、细节清晰“等,人物刻画会更细致
  • 【风格生成】添加“扁平化风格,logo”等,可以设计出各类图标等,例如 “猫猫头像,扁平化风格”
  • 【风格生成】指定颜色,或添加“烟雾缭绕”、“火焰”、“烟尘”、“花瓣”,生成画面的氛围感更饱满
  • 【创意生成】发挥想象力,例如:“中西混搭”、“泰迪熊唱京剧”、“米老鼠吃火锅”
  • 【风格生成】“水彩”,“水墨”与古诗组合,画面意境会有提升~
  • 【风格生成】想要日系头像和拟人化动物?试试关键词“日系手绘”、“治愈风”
  • 【风格生成】添加“pixiv”,生成二次元或者动漫的画质更惊艳

参考资料

推荐阅读

数据分析实战系列https://www.showmeai.tech/tutorials/40

机器学习数据分析实战系列https://www.showmeai.tech/tutorials/41

深度学习数据分析实战系列https://www.showmeai.tech/tutorials/42

TensorFlow数据分析实战系列https://www.showmeai.tech/tutorials/43

PyTorch数据分析实战系列https://www.showmeai.tech/tutorials/44

NLP实战数据分析实战系列https://www.showmeai.tech/tutorials/45

CV实战数据分析实战系列https://www.showmeai.tech/tutorials/46

AI 面试题库系列https://www.showmeai.tech/tutorials/48

中国风?古典系?AI中文绘图创作尝鲜!⛵的更多相关文章

  1. Hugging Face发布diffuser模型AI绘画库初尝鲜!

    作者:韩信子@ShowMeAI 深度学习实战系列:https://www.showmeai.tech/tutorials/42 TensorFlow 实战系列:https://www.showmeai ...

  2. Liunx环境下配置matplotlib库使用中文绘图

    最近在使用matplotlib库的过程中需要用到中文绘图,在网上找了好多种方法,最终用一种方法解决了,在此记录. 首先Linux是有自己的中文字体的,叫做"Droid Sans Fallba ...

  3. 微信团队分享:Kotlin渐被认可,Android版微信的技术尝鲜之旅

    本文由微信开发团队工程是由“oneliang”原创发表于WeMobileDev公众号,内容稍有改动. 1.引言   Kotlin 是一个用于现代多平台应用的静态编程语言,由 JetBrains 开发( ...

  4. Windows 10 周年版尝鲜

    早在今年的 Build 大会上,微软就开始宣传最新的 Windows 10 周年版更新,炫了不少特技,直到昨天(2016/8/2 PST)才正式放出,相关新闻可以参考这里,正式的版本为 Version ...

  5. Win10尝鲜体验——初识传说中不一样的Windows 分类: 资源分享 2015-07-24 18:27 13人阅读 评论(0) 收藏

    这几天,网上传来一个消息,虽然不知是好是坏,Win10可以下载安装了! 出于好奇,下载尝鲜,几个截图,留作纪念~ 中文,还是要好好支持的,毕竟中国有如此多的用户 可选的安装版本 许可条款也刚刚出炉,估 ...

  6. 从[Greenplum 6.0] 1分钟安装尝鲜开始

    Greenplum目前6版本目前已经迭代了几个小版本了,随着版本的更新,不断的有bug被修复. 打算试用的朋友可以入手了. 作为开年的第一个工作日的第一个帖子,必须从“开天辟地”的6.0开始.以下内容 ...

  7. 【翻译】五步快速使用LINQPad尝鲜StreamInsight

    StreamInsight  学习地址:http://www.cnblogs.com/StreamInsight/archive/2011/10/26/StreamInsight-Query-Seri ...

  8. 小程序新能力-个人开发者尝鲜微信小程序

    个人开发者的福利 微信小程序,刚听到这个新名词的时候,我就兴冲冲的去找入口,看看自己能不能搞个微信小程序的HelloWorld,毕竟能在微信上把自己写的一些小工具跑起来还是满炫酷的. 没想,网上一查, ...

  9. 【响应式】foundation栅格布局的“尝鲜”与“填坑”

      提到响应式,就不得不提两个响应式框架--bootstrap和foundation.在标题上我已经说明白啦,今天给大家介绍的是foundation框架. 何为"尝鲜"?就是带大伙 ...

  10. Spring-Data-JPA尝鲜:快速搭建CRUD+分页后台实例

    前言:由于之前没有接触过Hibernate框架,但是最近看一些博客深深被它的"效率"所吸引,所以这就来跟大家一起就着一个简单的例子来尝尝Spring全家桶里自带的JPA的鲜 Spr ...

随机推荐

  1. PAT (Basic Level) Practice 1024 科学计数法 分数 20

    科学计数法是科学家用来表示很大或很小的数字的一种方便的方法,其满足正则表达式 [+-][1-9].[0-9]+E[+-][0-9]+,即数字的整数部分只有 1 位,小数部分至少有 1 位,该数字及其指 ...

  2. MatrixOne从入门到实践03——部署MatrixOne

    MatrixOne从入门到实践--部署MatrixOne 前两章节我们简单介绍了MatrixOne和源码编译了MatrixOne.本章节将使用不同的部署方式,来部署MatrixOne的服务. 注意:不 ...

  3. 如何优雅的备份MySQL数据?看这篇文章就够了

    大家好,我是一灯,今天一块学习一下如何优雅安全的备份MySQL数据? 1. 为什么要备份数据 先说一下为什么需要备份MySQL数据? 一句话总结就是:为了保证数据的安全性. 如果我们把数据只存储在一个 ...

  4. tensorflow-gpu版本安装及深度神经网络训练与cpu版本对比

    tensorflow1.0和tensorflow2.0的区别主要是1.0用的静态图 一般情况1.0已经足够,但是如果要进行深度神经网络的训练,当然还是tensorflow2.*-gpu比较快啦. 其中 ...

  5. Linux自动切换用户

    Linux自动切换用户 一.创建sh文件 touch su_user.sh 二.下载脚本 yum install -y expect 三.脚本内容 #!/bin/bash# This is our f ...

  6. Vue学习之--------Vue生命周期beforeCreate、created、beforeMount、mounted、beforeDestroy 。。。(图解详细过程)(2022/7/17)

    文章目录 1.Vue生命周期 1.1 概念 1.2 图解 2.钩子函数的用法说明 2.1 beforeCreate()和created()的详细讲述 2.1.1 方法说明 2.1.2 代码实例 2.1 ...

  7. 一天五道Java面试题----第九天(简述MySQL中索引类型对数据库的性能的影响--------->缓存雪崩、缓存穿透、缓存击穿)

    这里是参考B站上的大佬做的面试题笔记.大家也可以去看视频讲解!!! 文章目录 1.简述MySQL中索引类型对数据库的性能的影响 2.RDB和AOF机制 3.Redis的过期键的删除策略 4.Redis ...

  8. 齐博x1万能数据统计之fun函数

    使用 fun("count@info",'数据表名','用户uid') 可以统计指定任何数据表的记录条数 fun("count@info",'cms_conte ...

  9. 前端JS获取路由地址里的参数QueryString取值

    参数的获取 声明一个函数 //参数name是路由参数 engNo function getQueryString(name) { var reg = new RegExp("(^|& ...

  10. Masked Label Prediction: Unified Message Passing Model for Semi-Supervised Classification

    背景 消息传递模型(Message Passing Model)基于拉普拉斯平滑假设(领居是相似的),试图聚合图中的邻居的信息来获取足够的依据,以实现更鲁棒的半监督节点分类. 图神经网络(Graph ...