关于nano banana模型实践的思考
Nano banana
Google提出的图片生成和编辑模型
这个不过多阐述
解决问题
这个模型重点是解决了什么问题? 为什么我们需要使用这个模型来解决问题, 对比传统的解决方案存在什么显著的优势?
解决了什么问题?
对于已有图片的二次编辑, 以及基于已有概念图的图片绘制. 这些问题都可以很好的被解决, 这是一个商业业务级别上都带来的巨大的性能提升的模型.
分享自己用到过的细致的使用场景:
- 科研的深度学习模型结构图绘制, 如果出现了不擅长配色, 那么可以让AI帮助你上色.
- 如果参考了别人的论文的模型, 现在需要重新绘制别人的结构图, 那么在缺少原绘图文件的情况下, 直接修改几个模块的配色和内容, 会较为麻烦, 因为需要自己从0绘制图片文件.
这个绘制环节如果找咸鱼外包出去也需要几十块钱到十几块钱不等.
对比已有方案的显著优势?
- 在缺乏图片源文件(就是例如drawio绘制出图片使用的原本的画布文件)的情况下, 修改原本图片文件中的一些内容变得极为困难.
困难体现在修改内容之前需要完全重新绘制全部的图片文件, 耗时长, 成本高
使用了AI之后, 这种修改可以让AI在10+Sec的时间完成需求, 耗时短, 成本低
缺点
- 该模型无法通过对话理解图片中细节部分内容的修改, 它很多时候的操作都是一些简单的(不需要深入理解的概念性的)问题
举一个例子: 我认为模型在相邻像素点之间的绘制是高度相关的(所以, 模型处理的好), 但是, 有些时候, 我们的图片元素呈现出有间隔的(例如, 物体之间存在空白背景等分割了物体像素点之间的直接联系)多个物体之间的关联(这些物体相互构成了一个图片的组, 一个组包含多个物体, 组内存在理解上的语义联系).
- 一旦模型第一次无法满足你的需求, 后面也就很难满足了, 因为prompt能给这个模型带来的性能和准确度提升有限.(我使用之后是这么认为的)
- 无法处理小目标, 如果文本内容的像素相距太近, 或者占用空间太小, 可能导致模型无法正常处理, 或者把2个元素当成1一个元素
构建prompt
参考 https://zhuanlan.zhihu.com/p/1944320444653105712 专栏中提到的内容, 但是指的注意的是: AI提示词工程需要的是临机应变, 尤其是我认为针对nano banana模型提示词格式很多时候并没有最佳实践范式
个人理解
我说明一下我的个人对于构建这个模型提示词的理解, 比较宽泛.
- 不同于其他的模型, 这个模型的任务描述不需要特别详细, 过多的细节描述对于nano banana来说可能难以做到. 最好是较为宽泛的限制, 给模型一定的操作空间, 模型可以操作的空间越大, 随机出效果可能会更加好.
- 英语描述 >> 中文描述, 使用英文提示词
- 尽可能是自然语言描述, 关键词描述不太适用.
LLM辅助提示词生成
考虑到需要连贯的英文自然语言来描述修改的需求, 所以, 使用LLM辅助进行提示词生成没准是个不错的选择.
我考虑使用gemini
给我一个英文提示词, 我需要操作nano banana模型进行图片编辑, 实现[你的需求].
- 提示词不要过于冗长
从而, gemini往往会给你多个简短提示词, 选择你需要的prompt
TIP
最后, 我认为人为的核验和校对十分重要, 这个模型还是容易出现单词拼写错误的情况. 针对错误的地方, 配合手动的PS修复图片内容.
关于nano banana模型实践的思考的更多相关文章
- SNF快速开发平台2019-用户安全控制-权限管理模型实践-权限都在这里
1.1 是否保存密码 勾选记住密码后,再次开启程序用户密码不需要再次输入,直接显示在密码输入框内,方便快捷. 图 4.1‑1 记住密码的登录页面框 1.2 是否自动登录 勾选自动登录后,再 ...
- SNF快速开发平台2019-权限管理模型实践-权限都在这里
其它权限实践系列文章: 1.角色.权限.账户的概念理解-非常全的理论讲解权限控制 https://www.cnblogs.com/spring_wang/p/10954370.html 2.权限管理模 ...
- Blinn-Phong反射模型实践(web实现)
Blinn-Phong反射模型实践(web实现) games101 第四次作业 最终完成带贴图的 Blinn-Phong 模型,产生光照效果 完成了 不带贴图的 Blinn-Phone 反射模型 带贴 ...
- Java 小记 — Spring Boot 的实践与思考
前言 本篇随笔用于记录我在学习 Java 和构建 Spring Boot 项目过程中的一些思考,包含架构.组件和部署方式等.下文仅为概要,待闲时逐一整理为详细文档. 1. 组件 开源社区如火如荼,若在 ...
- [转] 阿里研究员谷朴:API 设计最佳实践的思考
API是软件系统的核心,而软件系统的复杂度Complexity是大规模软件系统能否成功最重要的因素.但复杂度Complexity并非某一个单独的问题能完全败坏的,而是在系统设计尤其是API设计层面很多 ...
- Flutter 下载篇 - 叁 | 网络库切换实践与思考
前言 本文是关于使用flutter_download_manager下载功能的实践和探索.我们将基于flutter_download_manager的功能扩展,改造成自己想要的样子.在阅读本文之前,建 ...
- 关于ASP.NET WebAPI中HTTP模型的相关思考
对于.NET的分布式应用开发,可以供我们选择的技术和框架比较多,例如webservice,.net remoting,MSMQ,WCF等等技术.对于这些技术很多人都不会陌生,即时没有深入的了解,但是肯 ...
- 关于Mybatis的一次pingQuery时间间隔的实践及思考
转眼间离这次问题的实践过程已经过去了一两个月了,现在想来自己的问题并不是不知道那么简单了,所以很有必要记录下来,算是一次警戒吧 废话不多说,直入主题. 我的直接上级准备将公司的后台管理系统由PHP转为 ...
- CSS盒模型的深度思考及BFC
本文最初发表于博客园,并在GitHub上持续更新前端的系列文章.欢迎在GitHub上关注我,一起入门和进阶前端. 以下是正文. 题目:谈一谈你对CSS盒模型的认识 专业的面试,一定会问 CSS 盒模型 ...
- Java 小记 — RabbitMQ 的实践与思考
前言 本篇随笔将汇总一些我对消息队列 RabbitMQ 的认识,顺便谈谈其在高并发和秒杀系统中的具体应用. 1. 预备示例 想了下,还是先抛出一个简单示例,随后再根据其具体应用场景进行扩展,我觉得这样 ...
随机推荐
- 第2周 神经网络基础题numpy运用
1.使用 Numpy 的 Python 基础知识 import math def basic_sigmoid(x): s = 1/(1+math.exp(-x)) #math.exp(x):为e的x次 ...
- HyperWorks分析模型的建立与边界条件施加
在HyperWorks完成了基本的网格剖分后,还需要赋予模型各类与求解相关的信息,方能最终生成可以递交求解器计算的输入文件.分析模型的建立与载荷及边界条件的创建包括以下内容: -定义待输出的目标求解器 ...
- 首个离散元仿真软件EDEM好学吗?有什么学习技巧?
EDEM是一款首个离散元仿真软件,它被广泛应用于工程领域,特别是在颗粒材料的模拟和分析方面.对于初学者来说,EDEM可能会有一定的学习曲线,但是只要掌握了一些学习技巧,就能够很快上手并熟练运用这款软件 ...
- 电气设计软件有哪些?EPLAN让你成为专业工程师
作为一名电气设计师,掌握适合自己的设计软件至关重要.在本文中,我们将向您介绍五款广受欢迎的电气设计软件,无论您是初学者还是专业设计师,这些软件都能帮助您轻松完成各类电气设计任务.让我们一起来了解这些实 ...
- 关于shell脚本的正确入门姿态
.这两天工作无事,捣鼓齐了linux系统,对于简单的操作那个ok的,但从未接触过shell脚本,这篇文章便是记录一个如何入门shell,又在简历上又多了一项技能啦 ~ 1.什么是shell? ...
- wr30u刷immortalwrt
破解原路由器的ssh 原装的系统默认是不给普通用户登录SSH权限的. 没有此权限,就相无法管理路由器管底层理权限. 要刷机,就要必须破解获取SSH权限. 配置路由器 才买回来的路由器,插上电源,(此时 ...
- 保姆级vmware安装MacOS
为啥是v10.15 MacOS10.15对硬件的要求很低,一般是不会卡的 准备工作 开始之前,请先完成以下步骤: 你的计算机中装有VMware Workstation 15及以上版本, 并确定你的磁盘 ...
- I5TING_TOC转成的HTML,怎样高亮代码
找到安装位置全局安装一般在默认位置C:\Users\administrator\AppData\Roaming\npm\node_modules\i5ting_toc 修改marked.jsi5tin ...
- 解决Ubuntu上使用fsck命令时遇到的“The superlock could not be read......”的问题
问题产生原因:我也不太清楚,可能是给硬盘分区的时候出的问题. 问题解决方法:依次执行以下的命令,请根据实际情况调整存储设备名称. 注意:下面的操作会清空硬盘所有数据,请根据自己的需求来判断是否需要执行 ...
- 前端开发系列100-小程序篇之UI组件库的使用和封装
本文介绍微信小程序开发中常用的第三方UI组件库的基本使用流程和如何自定义组件. 1.0 第三方UI组件库的基本使用流程 通常,在使用第三方组件库之前首先需要通过代码的托管仓库和组件库文档来了解该组件库 ...