搭建一个图片变视频的AI(二):开始搭建
前一章介绍了模型相关,现在开始搭建。
一:下载,解压ComfyUI
https://github.com/comfyanonymous/ComfyUI
上面链接中也有安装过程,可以参考。
也可以直接进入文件夹,直接运行,差什么,安装什么(我比较喜欢这样,因为我之前pip可能已经安装过了某些包)。最好借助AI,报错直接复制给AI,让它给出建议。
python .\main.py
根据报错,差什么,安装什么 pip install ...
特别注意:我一直遇到的问题,安装使用GPU的包时:pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 。安装的版本是2.5.1,因为自动适配我的CUDA Version: 12.9版本。
但是在安装pip install xformers 时,会卸载 torch,重新安装 torch 时,安装2.4.0。导致版本冲突,最终解决方案:
先:
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cu121 然后:
pip install xformers==0.0.27.post2
结果完美适配我的CUDA。
不使用 xformers 也能运行,内存占用也非常大。建议尽可能使用 xformers
检查一下:
import torch print("CUDA 可用:", torch.cuda.is_available())
print("当前设备:", torch.cuda.get_device_name(0))
print("CUDA 版本:", torch.version.cuda)
print("cuDNN 版本:", torch.backends.cudnn.version())
运行:python .\gpu.py
CUDA 可用: True
当前设备: NVIDIA GeForce GTX 1080
CUDA 版本: 12.1
cuDNN 版本: 90100
二:安装ComfyUI Manager
https://github.com/Comfy-Org/ComfyUI-Manager
下载解压到文件夹 ComfyUI/custom_nodes/ 中。然后重新启动ComfyUI:python main.py。
如果报错,差什么,安装什么。
三:安装节点
1:下载ComfyUI-DynamiCrafterWrapper
https://github.com/kijai/ComfyUI-DynamiCrafterWrapper
下载解压到文件夹ComfyUI/custom_nodes/ 中。
2:模型下载:https://huggingface.co/Kijai/DynamiCrafter_pruned/tree/main
模型文件下载到文件夹\ComfyUI\models\checkpoints\ 中:
3: 然后重新启动ComfyUI:python main.py。如果报错,差什么,安装什么。
四:启动服务ComfyUI:python main.py
浏览器访问链接:
1:运行模型。这里可以自己研究添加节点,也可以直接使用DynamiCrafterWrapper提供的节点json(优先使用json)。json位置在 \ComfyUI\custom_nodes\ComfyUI-DynamiCrafterWrapper\examples,我使用的是dynamicrafter_i2v_example_01.json。
将这个json文件拖拽到浏览器中,这个时候ComfyUI Manager会自动检查是否需要安装其他插件,直接点击安装就行。
视频生成完成后,在文件夹 \ComfyUI\output\ 中。
2:注意选择的模型,越高档的模型占用CPU越大,选择的视频时间越长,占用GPU越大。
我的电脑GPU是专用8G,共享16G(可以不考虑,主要是专用GPU大小),这个配置一张图片生成视频(图片:914k,尺寸:576*1204,生成的视频3M,4s,8帧/s,尺寸576*1024),模型选择dynamicrafter_512。
一运行,GPU就100%,结果跑了一晚上才成功。
如果GPU小,可以选择更小的模型,DynamiCrafter256。图片也可以选小点的,生成的图片数调整小点。
三:总结
这种视频大模型要在本地运行,那本地机器必须是很强大才行,不然根本运行不动,那更不用说使用了。
后面再研究本地搭建图片+音频对嘴生成视频的AI.
搭建一个图片变视频的AI(二):开始搭建的更多相关文章
- Prism for WPF 搭建一个简单的模块化开发框架(二)
原文:Prism for WPF 搭建一个简单的模块化开发框架(二) 今天又有时间了,再改改,加了一些控件全局的样式 样式代码 <ResourceDictionary xmlns="h ...
- 跟我一起使用electron搭建一个文件浏览器应用吧(二)
这个文件浏览器应用可以具备以下两种功能噢- This file browser application can have the following two functions. 一:用户浏览文件夹和 ...
- 使用multer搭建一个图片接收服务器
为了测试图片上传插件的上传功能是否好用,最近尝试搭建了一个接收图片的服务器,因为图片上传的编码格式是form-data,所以我选择使用express+multer,实现过程中发现有几个需要注意的地方, ...
- node环境使用multer搭建一个图片接收服务器
为了测试图片上传插件的上传功能是否好用,最近尝试搭建了一个接收图片的服务器,因为图片上传的编码格式是form-data,所以我选择使用express+multer,实现过程中发现有几个需要注意的地方, ...
- 使用Hexo搭建一个简单的博客(二)
昨天想着用Hexo和github搭一个自己简单的博客,记录一下自己踩过的坑,具体的流程就不重复了,主要参考了一下几篇文章 GitHub+Hexo 搭建个人网站详细教程 使用Hexo+Github一步步 ...
- 【VIP视频网站项目二】搭建爱奇艺优酷腾讯视频官网首页轮播图效果及实现原理分析
这个是实现的效果,基本上轮播效果和主流网站的一致,但是我也在上面优化了一些效果, 可以在线预览效果:https://vip.52tech.tech/ 目前项目代码已经全部开源:项目地址:https:/ ...
- Django1.8教程——从零开始搭建一个完整django博客(二)
在上一节中,我们已经创建了一个Django模型Post,并使Post模型与数据库同步.这一节中,我们将介绍Django管理站点,通过Django管理站点来管理我们创建的Post模型实例. 为你的模型创 ...
- 跟我一起用node-express搭建一个小项目(mongodb)[二]
我的小项目主要是会用到MongoDB. 呵呵,我也是现学现卖. 都说小公司十八般武艺样样稀疏,没有办法啊! 兵来兵挡,将来将挡!自己是个兵呢?还是一个将呢! 没有公司培养,就自己培养自己呗.差的远一点 ...
- 如何使用 Gin 和 Gorm 搭建一个简单的 API 服务 (二)
创建 API 我们之前已经跑过 Gin 框架的代码,现在是时候加些功能进去了. 读取全部信息 我们先从"增删改查"中的"查"入手,查询我们之前添加的信息.我接下来要删除几行代码,并把 Gin ...
- 从零开始用 Flask 搭建一个网站(二)
从零开始用 Flask 搭建一个网站(一) 介绍了如何搭建 Python 环境,以及 Flask 应用基本项目结构.我们要搭建的网站是管理第三方集成的控制台,类似于 Slack. 本篇主要讲解数据如何 ...
随机推荐
- Java的IO模型、Netty原理详解
1.什么是IO 虽然作为Java开发程序员,很多都听过IO.NIO这些,但是很多人都没深入去了解这些内容. Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的 ...
- Model接口
/** * Model接口 * 作用:将值存放到request对象 * * * @return */ @RequestMapping(value = "/testModle") p ...
- 🎀dubbo QOS介绍及命令
简介 在Dubbo中,QoS(Quality of Service)功能是一个非常重要的特性,用于提供对运行时服务的查询和控制能力. QoS的概念源自网络设备中的服务质量保障机制,但在Dubbo中,它 ...
- VMware平台的Ubuntu部署完全分布式Hadoop环境
前言: 此文章是本人初次部署Hadoop的过程记录以及所遇到的问题解决,这篇文章只有实际操作部分,没有理论部分.因本人水平有限,本文难免存在不足的地方,如果您有建议,欢迎留言或私信告知于我,非常感谢. ...
- 康谋分享 | 直面AD/ADAS快速开发挑战:IVEX自动驾驶场景管理及分析平台!
过去十年,自动驾驶和高级驾驶辅助系统 (AD/ADAS) 软件和硬件的开发成为了各大汽车公司的主要投资目标之一.各大汽车公司对 AD/ADAS 持续不断的投资加快了 AD/ADAS 组件的开发周期,但 ...
- 如何基于 Kestrel 实现 socks5 代理
前言 之前做了个轮子NZOrz, 本来打算慢慢参照Kestrel和Yarp长久地写着玩 奈何川普上台,关税,订婚案,自身和钱包等等各种乐子层出不穷,无暇慢悠悠地写轮子玩 还有有些盆友也想知道能否直接使 ...
- Dubbo实战:四步实现注册中心平滑迁移原创
写在前面 如题,这是一个真实存在的业务场景.在微服务体系的迭代过程中,会存在注册中心的切换,典型如从zookeeper迁移到nacos. 最近面试中,经常会用该场景来考察候选人(涉及RPC.分布式 ...
- SQL 日常练习 (十七)
五一了, 2020过去近乎一半了, 疫情原因, 哪都没去, 其实与其出去玩, 不如呆着学习, 终身学习, 学无止境, 气有浩然, 这是我从上大学开始一直刻在脑海的训诫. 都说今年很艰难, 回头一想, ...
- C#开发的Panel滚动分页控件 - 开源研究系列文章
前些时候因为想拥有一个自己的软件快捷打开软件,于是参考Windows 11的开始菜单,进行了编写这个应用软件,里面有一个功能就是对显示的Panel里的应用对象的分页功能,于是就想写一个对Panel的自 ...
- useEffect的那些坑,你知道多少
@charset "UTF-8"; .markdown-body { line-height: 1.75; font-weight: 400; font-size: 14px; o ...