智影AI故事转视频创作神器!快速开启AI绘画小说推文之旅
1.前言
1.1 生成内容形式
生成内容形式主要包含三种,PGC(Professionally Generated Content)、UGC(User Generated Content)、AIGC(Artificially Intelligent Generated Content)。也可以简单理解为生成内容形式的三个发展阶段。
- PGC 专业生成内容
专业生成内容是由专业人士创作编辑发布内容。
简单来说是文章要由作者创作,新闻要由记者创作,专业的人创作内容。
该形式起源于传统媒体时代,例如报纸、杂志、电视、电影等。
- UGC 用户生成内容
用户生成内容是由普通用户创作编辑发布内容。
简单来说就是每个人都可以创作内容,通过互联网发布文字、视频、音频等内容。
是互联网趋势下的一种内容生成方式,对传统营销、广告、媒体等产业产生了重大影响。比如自媒体博主等。 优点是创作门槛低,内容更加个性化,缺点是信息泛滥,质量不一,监管难度大等。
- AIGC 人工智能生成内容
人工智能生成内容是AI创作生成内容。
简单来说就是已经发展到我们看到的内容可能就是AI制作的。
是人工智能发展阶段下的一种新型内容生成方式。利用自然语言处理技术与AI技术来生成内容。比如ChatGPT、PiKa、Sora、文心一言等。
应用范围广泛,发展到今天,已经支持多模态AI,允许输入文本、图片、视频等多种媒体素材,经由AIGC处理输出生成想要的文本、图片、视频、音频等内容。
1.2 小说推文说明
2021年起,市场开始探索小说推文,通过爆火小说,借助抖音、小红书、bilibili等平台发布小说推文视频,推流达到吸粉,引导付费的模式实现盈利,逐步发展趋于稳定盈利。
2023年是小说推文的爆发期,加上火爆的ChatGPT、Midjounery、TTSMAKER、剪映等平台支撑,形成了一套完善的生成式AI链路。极大的降低了小说推文制作门槛,且据统计当时随便制作一个推文视频,播放量基本上在20W左右。
2024年Sora发布的文生视频大模型,给国内外带来了极大震撼,时长接近1分钟,视频画质接近电影级。让人感叹AI已经发展到,快要不易区分人工制作内容和AI制作内容。同时也让国内感受到和国外在人工智能领域的差距。
2.产品介绍
本期说下国内小说推文工具,不是那种素材混剪的工具,而是借助多模态生成式AI,具备文生图、图生视频、文生视频能力的工具。
比如腾讯动态漫画、AI剧本、瓦兔推文、极虎漫剪、推文助手、智影AI等工具。
这些工具大都支持文生图能力,但支持图生视频能力仅腾讯动态漫画、智影AI。动态漫画生成分镜图片后,有个一键动效功能,允许将图片生成2s时长的视频。智影AI有一个动态视频功能,允许将图片生成4s的视频。
2.1 产品说明
一款小白也能轻松制作故事转视频的AI创作神器。
2.2 功能说明
- 拆分文案
产品能够对故事文案进行拆分镜头,提取故事中的角色和场景;并自动绑定角色/场景和分镜镜头,达到角色场景一致性。
借助ChatGPT分析文案拆分分镜,提取角色场景。
- 角色/场景创建
角色/场景支持新建编辑;支持调整角色描述重新生成角色图片。
- 分镜管理
支持对分镜批量绑定关联角色/场景;镜头支持新建编辑;支持修改分镜描述重新生成分镜图片;支持分镜图片生成4s的动态视频。
借助Fooocus(已支持)、Midjounery(规划中)文生图能力,根据文本描述AI绘图。
借助Stable Diffusion Video(已支持)、PiKa(规划中)图生视频能力,根据分镜图片AI生成视频。
- 合成视频
允许选择背景音乐,解说音色,解说语速等;允许对字幕、标题调整字号、粗体、下划线等、支持配置花字效果。
借助剪映、阿里云视频合成,拼接音频、字幕、视频、图片制作视频
3.推文视频制作
3.1 新建小说
填写小说名称、选择画面风格、小说类型,点击确定新建小说。
一组镜头可以合成一个视频。这一组镜头构成一个作品。多个作品构成一个小说。

3.2 新建作品
填写作品名称、选择分辨率、选择是否开启动态视频,默认不开启,点击确定新建作品。
3.3 拆分文案
粘贴复制过来故事文案,此处是通过文心一言生成的300字左右的故事文案。点击拆分文案拆分分镜,自动提取角色场景,并自动绑定角色场景到分镜。


3.4 角色/场景创建
智影AI会自动提取角色场景,如果AI提取存在漏提或误提的情况,可以手工维护角色/场景,新建或重新生成角色图片。

确认角色场景后,可以点击下一步,提示是否跳过一键生图。不跳过则自动生成分镜图片。跳过则不自动生成分镜图片,手工生成。此处点击确定,使用一键生图功能,希望自动生图。

3.5 分镜管理
上一步不跳过一键生图,会自动对分镜提交生成图片任务。
如果上一步跳过一键生图,也可以进入到分镜管理步骤后,维护好分镜信息,再点击一键生图按钮即可。或者手工对单个镜头右侧编辑区域,点击重新生成图片按钮重新生图。

待图片任务全部生成完成,可以点击合成视频进入下一步。

3.6 合成视频
合成视频可以选择背景音乐、解说音色、字幕标题等配置,点击合成视频等待视频合成。

在小说作品列表可以查看作品合成视频效果。


4.高阶功能说明
4.1 角色/场景一致性
角色一致性,对于以上示例,因为用的形象是蝙蝠侠,AI对蝙蝠侠其实是有很多知识存储的,所以在角色一致性上表现良好。
对于AI不知道的角色,通过AI工具实现角色一致性就比较困难了。同样的文案描述,在多次生成结果上无法保证角色形象一致,场景一致。
此处提供角色场景绑定功能,来间接实现角色场景一致性。
在分镜管理下,允许对单个镜头进行角色场景绑定。也提供了批量操作,对于分镜较多的作品,避免重复操作提升效率。


4.2 重新生图
- 重新生图
对于一键生图效果不好的情况下,或者重新调整关联角色场景后的分镜,可以修改分镜描述重新生图。
- 生成相似图
生成相似图,利用以图生图能力,生成相近效果的图片,可以用作微调。
- 上传分镜图片
开放了上传分镜图片的功能,更加的灵活,允许设计师上传自己做的图片,如果认为AI绘图效果不好,或者根据AI绘图本地调优后,可以上传覆盖。
- 替换当前图片
历史图片可以看到生成过的图片,多次生图可以选择效果较好的一张,替换当前图片作为分镜图片。
- 放大1.5倍、放大2倍
支持放大1.5、放大2倍,使得图片分辨率清晰度更高。可以在选定分镜图片后,放大图片质量用于合成视频,保证视频质量。

4.3 合成视频
- 转场、特效、音色
支持对分镜配置转场特效,也可以配置全局默认转场特效。单分镜支持配置多情感音色,间接实现了多角色多音色功能。

- 上传背景音乐
系统提供的背景音乐无法满足所有用户的真实需求,允许上传个性化的背景音乐。

- 字幕标题花字效果
字幕标题支持花字、字号、粗体、斜体等配置。标题非必填。

4.4 动态视频
启用动态视频,支持将分镜图片转换为视频内容。

对于开启动态视频能力的作品,在分镜图片调整完成后,点击一键生成视频,可以对分镜图片生成4s的视频。
允许调试图生视频参数,与图片的一致性、运动强度、种子等参数,重新生成视频。
开启动态视频能力的作品,在合成视频时,将采用分镜视频素材代替分镜图片素材来合成视频,合成推文视频效果更佳。传统的图片就是PPT播放效果,动态视频就是真正意义上的视频了。

扩展:Sora、PiKa、Runway、SVD等AI视频能力,也是未来AI电影、AI广告、AI新闻等产业的发展方向。
Sora官网:openai.com/sora
PiKa官网:pika.art
Runway官网:runwayml.com
Stable Video官网:stablevideo.com
Fooocus官网:fooocus.cc
MidJounery官网:midjourney.com
智影AI故事转视频创作神器!快速开启AI绘画小说推文之旅的更多相关文章
- UWP 手绘视频创作工具技术分享系列 - 有 AI 的手绘视频
AI(Artificial Intelligence)正在不断的改变着各个行业的形态和人们的生活方式,图像识别.语音识别.自然语言理解等 AI 技术正在自动驾驶.智能机器人.人脸识别.智能助理等领域中 ...
- UWP 手绘视频创作工具 “来画Pro” 技术分享系列
开篇先来说一下我和来画的故事,以及写这篇文章的初衷. 今年年初时,我还在北京,在 Face++,做着人脸识别技术的 Windows 和 Android 端,做着人工智能终将实现世间所有美好的梦.这时的 ...
- 云端智创 | 批量化生产,如何利用Timeline快速合成短视频?
本文内容整理自「智能媒体生产」系列课程第三讲:开发者实战,由阿里云智能视频云技术专家分享云剪辑Timeline的功能及使用方法.云剪辑OpenAPI的使用流程.短视频批量生产的基本原理以及使用Time ...
- UWP 手绘视频创作工具技术分享系列
开篇先来说一下写这篇文章的初衷. 初到来画,通读了来画 UWP App 的代码,发现里面确实有很多比较高深的技术点,同时也是有很多问题的,扩展性,耦合,性能,功能等等.于是我们决定从头重构这个产品,做 ...
- UWP 手绘视频创作工具技术分享系列 - 全新的 UWP 来画视频
从2017年11月开始,我们开始规划和开发全新的来画Pro,在12月23日的短视频峰会上推出了预览版供参会者体验,得到了很高的评价和关注度.吸取反馈建议后,终于在2018年1月11日正式推出了全新版本 ...
- AI通过了艺术创作图灵测试,你根本分不出来作者是不是人
各位geek朋友们,今年不用再看画了:近年来最大的艺术成就已经发生了. 这项艺术成就的诞生地,不是北京.新加坡.柏林郊区颜料四溅的画室中,不是威尼斯双年展上.请记住它出现的地点:美国新泽西州新布朗斯维 ...
- UWP 手绘视频创作工具技术分享系列 - 手绘视频导出
手绘视频最终的生成物是视频文件,前面几篇主要讲的是手绘视频的创作部分,今天讲一下手绘视频的导出问题.主要以 UWP 为例,另外会介绍一些 Web 端遇到的问题和解决方法. 如上所述,手绘视频在创作后, ...
- UWP 手绘视频创作工具技术分享系列 - Ink & Surface Dial
本篇作为技术分享系列的第四篇,详细讲一下手绘视频中 Surface Pen 和 Surface Dial 的使用场景. 先放一张微软官方商城的图,Surface 的使用中结合了 Surface Pen ...
- 短视频:用快影制作3D音乐视频
用快影制作3D音乐视频1打开快影点击开始剪辑导入一张风景照片,按住照片向后拉到自己需要的时长2点击画中画,点击新增,画中画,导入一张照片3点击模板,选择圆形,调整圆形的大小,摆放到上面合适的位置,按照 ...
- 短视频正当时,如何让你的App快速构建视频创作能力?
视频编辑服务(Video Editor Kit)是华为开放给开发者快速构建视频编辑能力的服务,提供视频导入.编辑处理.特效渲染.视频导出.媒体资源管理等一站式视频处理能力.视频编辑服务为全球开发者提供 ...
随机推荐
- 直播预告丨Hello HarmonyOS进阶课程第四课——ArkUI动画开发
为了帮助初识HarmonyOS的开发者快速入门,我们曾推出Hello HarmonyOS系列课程,从最基础的配置IDE和创建Hello World开始,详细介绍HarmonyOS基础.开发环境搭建.I ...
- 重新点亮shell————管道和重定向[二]
前言 简单介绍一下管道和重定向. 正文 管道和信号一样,是进程通信的方式之一 管道符是"|",将前一个命令执行的结果传递给后面的命令. 比如说: ls -l | more 就是第一 ...
- 01矩阵-【BFS】
01矩阵 给定一个由 0 和 1 组成的矩阵,找出每个元素到最近的 0 的距离.两个相邻元素间的距离为 1 ,方格斜方向不计算距离. 示例 1: 输入: [0 0 0 0 1 0 0 0 0] 输出: ...
- docker搭建kafka集群实践
前言 本文主要介绍了如何通过docker搭建一个可以用于生产环境的kafka集群. kafka集群使用了3个节点,依赖zookeeper进行协调,所以会同时搭建一套3节点的zookeeper集群. 准 ...
- 什么是token,为什么需要token
1.为什么需要token 随着互联网的发展,为了更安全,以及更好的用户体验,逐渐产生了token这个技术方案 之所以使用token是因为http/https协议本身是无状态的,不能进行信息的存储 (c ...
- 力扣1113(MySQL)-报告的记录(简单)
题目: 动作表:Actions 此表没有主键,所以可能会有重复的行. action 字段是 ENUM 类型的,包含:('view', 'like', 'reaction', 'comment', 'r ...
- 力扣344(java & python)-反转字符串(简单)
题目: 编写一个函数,其作用是将输入的字符串反转过来.输入字符串以字符数组 s 的形式给出. 不要给另外的数组分配额外的空间,你必须原地修改输入数组.使用 O(1) 的额外空间解决这一问题. 示例 1 ...
- 将 Terraform 生态粘合到 Kubernetes 世界
简介: 为了更高效,统一的管理云服务,IaC 思想近年来盛行,其中 Terrafrom 更是成功得到了几乎所有的云厂商的采纳和支持.以 Terrafrom 模型为核心的云服务 IaC 生态已经形成.然 ...
- DTCC 2020 | 阿里云程实:云原生时代的数据库管理
简介: 随着云原生技术的不断发展,数据库也逐渐进入了云原生时代.在云原生时代,如何高效.安全且稳定地管理云上与云下的数据库成为摆在企业面前的一大难题.在第十一届中国数据库技术大会(DTCC2020)上 ...
- EventBridge消息路由|高效构建消息路由能力
简介:企业数字化转型过程中,天然会遇到消息路由,异地多活,协议适配,消息备份等场景.本篇主要通过 EventBridge 消息路由的应用场景和应用实验介绍,帮助大家了解如何通过 EventBridg ...