大家好,我是程序员鱼皮。之前分享了 如何利用 AI 生成 ASMR 视频动物奥运会视频,给大家推荐了 Google Flow 这个 AI 视频创作工具。

Google Flow 可以直接使用最新的 Veo 3 视频生成模型,效果很不错,给不了解 AI 的朋友看了谁不说一句 “我曹刘哔!”

而且只要有足够的点数,不限制每日使用次数!对自媒体创作者来说非常友好了。

不过目前的视频模型生成视频的时长都比较短,一般是 5 ~ 8 秒,根本就不够看。

那如果想生成长视频怎么办呢?

下面就来分享如何利用 Google Flow 制作 AI 长视频,依然是保姆级教程。

传统 AI 长视频制作套路

一种思路是,将长视频分解为多个短视频,每个短视频是一个分镜,单独交给 AI 去生成,最后再利用视频剪辑软件合成到一起。我们现在看到的很多 AI 长视频,都是用这个套路制作的,所以你会发现很多 AI 视频每隔 5 ~ 8 秒就会换一个场景或视角。

比如下面这个 Youtube 上播放 1300 多万的 AI 视频 —— 橘猫和山羊的故事:

我们可以直接利用 AI 生成包含分镜的视频脚本和对应的提示词,你只需要用自然语言描述自己想讲的故事就好,就像这样:

但这样生成的视频很容易出现一个问题 —— 不同分镜之间没有关联

比如分镜 1 和分镜 2 的小猫品种不同、故事背景也不同,一会儿在办公室、一会儿在学校,这样生成的视频必然会给人一种割裂感。

以前如果想解决这个问题,你需要全局增加角色、背景、风格等设定,或者提供参考图给 AI,限制一下它天马行空的想象力。利用系统提示词就能实现,比如:

你是一位专业的 AI 视频制作专家,擅长创作连贯性强、视觉统一的视频内容。
下面我会给你一些剧情场景,请帮我生成对应的 AI 视频生成提示词。
核心要求,每个提示词都必须严格保持以下元素的统一性:
- 角色:一只橘猫(毛色温暖,表情丰富,体态匀称)
- 背景:破旧的村庄(石头房屋,青苔覆盖,古朴沧桑)  
- 风格:写实风格(自然光照,细节丰富,色彩饱和度适中)
- 镜头:电影级构图,景深自然,光影层次分明

但这样做会给 AI 视频生成带来更多的随机性,毕竟写好提示词并不容易。鱼皮苦练提示词将近两年半,现在也不敢说自己提示词写的很牛。

所以不建议刚开始学 AI 长视频制作的朋友用上面这种方法,光写提示词就得浪费大半天的时间。下面我会分享一种更简单、效果更好的方法 —— 基于 Google Flow 制作 AI 长视频。

基于 Flow 制作 AI 长视频

Google Flow 是 Google 推出的 AI 视频创作平台,支持 Google 最先进的模型(Veo、Imagen 和 Gemini)。相比直接使用 Gemini 聊天界面,Flow 提供了更专业的视频制作功能,包括首尾图生成、素材图转视频、视频扩展等高级功能,能够让你生成讲述完整故事的视频。

官网:https://labs.google/fx/tools/flow

创建 Flow 项目,然后选择 AI 模型。目前有 2 个版本,不同版本的模型效果和价格都不同。

  • 高质量版 Quality:100 点/视频(约 7 元)

  • 快速版 Fast:20 点/视频(约 1.4 元)

一般情况下来说,使用 Veo 3 - Fast 版本就足够了,毕竟能便宜好几倍的价格,等提示词优化到满意后再用 Quality 版本精修。

不过再怎么说,AI 生成视频的成本也比找个团队定制视频要低的多,现在很多广告都是用 AI 生成的了。

下面让我来做一个 “小猫敲代码遇到 Bug 怒砸电脑” 的视频。可以利用 AI 生成视频提示词,我只需要编故事大纲就好了:

我想使用 veo3 基于文本生成视频,请帮我生成中文和英文的提示词,我想讲的故事如下:一只可爱的小白猫正在敲代码,突然遇到了 bug,她很生气地用小拳头锤了电脑几下,然后拿起锤子咋坏了电脑

AI 生成的中文提示词:

连续镜头:一只毛茸茸的白色小猫专注地在电脑前敲代码,突然屏幕出现错误提示,小猫瞪大眼睛,表情从专注变为愤怒,耳朵向后贴着。它举起小拳头愤怒地锤击键盘几下,然后拿起桌边的小锤子,高高举起用力砸向屏幕,屏幕瞬间破碎冒火花,小猫满意地点头走开。音效:键盘敲击声、错误提示音、愤怒的喵叫声、拳头敲击声、锤子砸击声、玻璃破碎声、电路短路声。

英文提示词:

continuous shot: An adorable fluffy white kitten focuses intently on coding at a computer when suddenly error messages appear on screen. The kitten's eyes widen, expression shifting from concentration to fury with ears flattening back. It raises tiny fists to angrily pound the keyboard several times, then grabs a small hammer from the desk, lifting it high to strike the screen forcefully. The screen instantly shatters with sparks flying as the satisfied kitten nods and walks away. Audio: keyboard clicking, error notification sounds, angry meowing, fist thumping, hammer strikes, glass shattering, electrical short-circuit sounds.

在对话框输入 英文提示词,就可以生成视频:

我觉得效果挺不错的,猫猫很可爱,虽然代码显示在了屏幕后面反常理,但这也更容易引发吐槽嘛,发网上必火的节奏哈哈~

接下来,我们可以点击 Add to scene,把生成的视频添加到场景:

点击添加到场景后,进入了视频剪辑页面,接下来我们要在这里创作多分镜视频:

点击视频轨道上的加号就可以创建新视频片段,提供了两种方法 —— 跳转和扩展:

我们希望视频基于某一个画面延续,就点击 Extend 扩展

我再利用 AI 生成一段中文和英文提示词,接着刚刚的故事:又来一只猫妈妈,觉得小猫不懂事,教训小猫,小猫一脸委屈。

AI 生成的中文提示词:

连续镜头:一只优雅的猫妈妈从门口走进房间,看到满地电脑碎片和冒烟的显示器,表情从疑惑变为严厉。她走向还拿着小锤子的小白猫,用爪子指着破碎的电脑严厉训斥。小白猫手中的锤子掉落,低下头露出委屈巴巴的表情,大眼睛含着泪水,小耳朵耷拉着,偶尔偷瞄猫妈妈又快速低头,小爪子无助地搓着。音效:脚步声、猫妈妈严厉的训斥声、锤子掉落声、小猫委屈的呜咽声和轻微抽泣声。

AI 生成的英文提示词:

continuous shot: An elegant mother cat enters the room from the doorway, seeing scattered computer debris and smoking monitor, her expression shifting from confusion to sternness. She approaches the little white kitten still holding the hammer, pointing at the broken computer while scolding severely. The kitten drops the hammer, hangs its head showing a pitiful expression with big teary eyes and drooping ears, occasionally stealing glances at mother cat before quickly looking down, little paws fidgeting helplessly. Audio: footsteps, mother cat's stern scolding sounds, hammer dropping, kitten's pitiful whimpering and soft sniffling.

大概要等待 2 分钟左右,不过我还挺享受 AI 生成视频的等待过程,像开盲盒一样刺激,充满期待:

看下生成的效果,我们会发现背景的细节是和上一个视频有关联的,比如桌上的笔、台灯。但是电脑不太一致,之前是个笔记本,怎么突然变成台式了?有一点出戏,跟我想的扩展效果还是差了一些。

你们觉得这两个视频中的猫是同一只么?

再试试另一种生成方法 Jump to,跳转到一个新场景

让 AI 生成一段中文和英文提示词,接着刚刚的故事:小猫决定离家出走,背上行囊,临行前不舍地回头看了一眼家门。

AI 生成的中文提示词:

连续镜头:委屈的小白猫在房间里用小爪子收拾行李,将衣服和玩具塞进花色小背包,偶尔擦擦眼泪。它背上比身体还大的背包,深吸一口气抬起下巴做出勇敢表情,迈着坚定步伐走向门口。到达门槛时突然停下,缓缓回头用含泪的大眼睛深情凝视着温馨的家,夕阳余晖洒在它小小身影上,营造出感人的离别氛围。音效:收拾物品声、背包拉链声、脚步声、轻柔风声、小猫的轻叹声。

AI 生成的英文提示词:

continuous shot: The dejected little white kitten packs belongings in its room, using tiny paws to stuff clothes and toys into a patterned backpack, occasionally wiping tears. It shoulders the backpack bigger than its body, takes a deep breath and lifts its chin with brave expression, walking determinedly toward the door. Upon reaching the threshold, it suddenly stops, slowly turning to gaze affectionately at the warm home with teary eyes, sunset light bathing its small figure in a touching farewell scene. Audio: packing sounds, backpack zipper, footsteps, gentle wind, kitten's soft sigh.

So Sad!小猫最后由于不听话,被赶出了家:

感觉这个视频和之前的画面衔接的很好,背景都是一致的,细节电脑还在冒烟。

那么 Extend 和 Jump To 应该如何选择呢?

目前来说我的建议是 优先用 Jump To,因为它支持 Veo 3 高质量模型,测试下来效果也更好:


我自己体验下来,使用 Flow 做 AI 长视频的效率和效果都比传统的方法更胜一筹,可以说 Flow 进一步降低了 AI 长视频的创作门槛,能够更好地保证连续视频一致性。

但是感觉 Flow 的视频编排能力不是很好用,建议导出多段视频后自己剪辑,再配上一些字幕和音效,那味儿不就来了么?

最后,我必须感叹 AI 视频的发展太快了,预计未来半年,AI 长视频的制作成本还会进一步降低。终有一天,我们看到的大多数视频,可能都是由 AI 生成的了。

大家有没有用过类似的 AI 视频工具?欢迎在评论区分享一下。记得点赞收藏,方便以后查看~

更多编程学习资源

用 AI 制作超长视频,保姆级教程!的更多相关文章

  1. 微软 New Bing AI 申请与使用保姆级教程(免魔法)

    本文已收录到 AndroidFamily,技术和职场问题,请关注公众号 [彭旭锐] 提问. 大家好,我是小彭. 最近的 AI 技术实在火爆,从 OpenAI 的 ChatGPT,到微软的 New Bi ...

  2. 保姆级教程——Ubuntu16.04 Server下深度学习环境搭建:安装CUDA8.0,cuDNN6.0,Bazel0.5.4,源码编译安装TensorFlow1.4.0(GPU版)

    写在前面 本文叙述了在Ubuntu16.04 Server下安装CUDA8.0,cuDNN6.0以及源码编译安装TensorFlow1.4.0(GPU版)的亲身经历,包括遇到的问题及解决办法,也有一些 ...

  3. 自建本地服务器,自建Web服务器——保姆级教程!

    搭建本地服务器,Web服务器--保姆级教程! 本文首发于https://blog.chens.life/How-to-build-your-own-server.html. 先上图!大致思路就是如此. ...

  4. Eclipse for C/C++ 开发环境部署保姆级教程

    Eclipse for C/C++ 开发环境部署保姆级教程 工欲善其事,必先利其器. 对开发人员来说,顺手的开发工具必定事半功倍.自学编程的小白不知道该选择那个开发工具,Eclipse作为一个功能强大 ...

  5. 强大博客搭建全过程(1)-hexo博客搭建保姆级教程

    1. 前言 本人本来使用国内的开源项目solo搭建了博客,但感觉1核CPU2G内存的服务器,还是稍微有点重,包括服务器内还搭建了数据库.如果自己开发然后搭建,耗费时间又比较多,于是乎开始寻找轻量型的博 ...

  6. RocketMQ保姆级教程

    大家好,我是三友~~ 上周花了一点时间从头到尾.从无到有地搭建了一套RocketMQ的环境,觉得还挺easy的,所以就写篇文章分享给大家. 整篇文章可以大致分为三个部分,第一部分属于一些核心概念和工作 ...

  7. 保姆级教程:用GPU云主机搭建AI大语言模型并用Flask封装成API,实现用户与模型对话

    导读 在当今的人工智能时代,大型AI模型已成为获得人工智能应用程序的关键.但是,这些巨大的模型需要庞大的计算资源和存储空间,因此搭建这些模型并对它们进行交互需要强大的计算能力,这通常需要使用云计算服务 ...

  8. 保姆级教程!手把手教你使用Longhorn管理云原生分布式SQL数据库!

    作者简介 Jimmy Guerrero,在开发者关系团队和开源社区拥有20多年的经验.他目前领导YugabyteDB的社区和市场团队. 本文来自Rancher Labs Longhorn是Kubern ...

  9. 保姆级教程,如何发现 GitHub 上的优质项目?

    先看再点赞,给自己一点思考的时间,微信搜索[沉默王二]关注这个靠才华苟且的程序员.本文 GitHub github.com/itwanger 已收录,里面还有一线大厂整理的面试题,以及我的系列文章. ...

  10. 保姆级教程,带你认识大数据,从0到1搭建 Hadoop 集群

    大数据简介,概念部分 概念部分,建议之前没有任何大数据相关知识的朋友阅读 大数据概论 什么是大数据 大数据(Big Data)是指无法在一定时间范围内用常规软件工具进行捕捉.管理和处理的数据集合,是需 ...

随机推荐

  1. nodejs新进程子进程

    获取进程相关的基本信息 #!/bin/env node console.log (process.execPath) console.log (process.cwd()) console.log ( ...

  2. 0x03 搜索与图论

    搜索与图论 广度优先搜索\(BFS\) 概念 广度优先搜索(Breadth-First Search)是一种图遍历算法,用于在图或树中按层次逐层访问节点.它从源节点(起始节点)开始,首先访问源节点的所 ...

  3. DelayQueue的take方法底层原理

    一.DelayQueue的take()方法底层原理 DelayQueue 的 take 方法是其核心方法之一,用于从队列中获取并移除延迟时间到期的元素.如果队列为空或没有延迟到期的元素,调用 take ...

  4. Sentinel源码—9.限流算法的实现对比

    大纲 1.漏桶算法的实现对比 (1)普通思路的漏桶算法实现 (2)节省线程的漏桶算法实现 (3)Sentinel中的漏桶算法实现 (4)Sentinel中的漏桶算法与普通漏桶算法的区别 (5)Sent ...

  5. windows下redis设置redis开机自启动

    windows系统下启动redis命令 进入redis安装目录 cd redis 输入 redis-server.exe redis.windows.conf 启动redis命令,看是否成功 可能会启 ...

  6. 3.4K star!全能PDF处理神器开源!文档转换/OCR识别一键搞定

    嗨,大家好,我是小华同学,关注我们获得"最新.最全.最优质"开源项目和高效工作学习方法 PDF-Guru 是一款开箱即用的全能型PDF处理工具,支持跨平台文档转换.智能OCR识别. ...

  7. 【BUG】Hexo|GET _MG_0001.JPG 404 (Not Found),hexo博客搭建过程图片路径正确却找不到图片

    我的问题 我查了好多资料,结果原因是图片名称开头是_则该文件会被忽略...我注意到网上并没有提到这个问题,遂补了一下这篇博客并且汇总了我找到的所有解决办法. 具体检查方式: hexo生成一下静态资源: ...

  8. 【笔记】Excel 2021|VBA删除数组中的一个元素、循环时删除一行、选择一列删除指定一行

    主要问题是循环的时候删除一行比较麻烦,因为删除了一行后,循环仍然直接访问后一行,会导致一定的异常. 文章目录 选择一列,删除指定一行 删除数组中的一个元素 方法1:利用动态数组,在循环中条件判断删除 ...

  9. C#开发的PDF文件浏览器 - 开源研究系列文章 - 个人小作品

    以前个人的PDF浏览主要是用的Adobe DC的PDF,不过它这个打开速度还是一般.后来安装的极速PDF浏览器,速度还是比较快的了.它这个主要是浏览,然后还能够安装编辑器对PDF文件进行编辑,不过就需 ...

  10. 牛客小白月赛111 E 构造矩形

    E 构造矩形 原题链接:https://ac.nowcoder.com/acm/contest/102742/E 思路: 这种询问方案数或者"价值"的题,通常解法要么是维护前缀信息 ...