前一章介绍了模型相关,现在开始搭建。

一:下载,解压ComfyUI

https://github.com/comfyanonymous/ComfyUI

上面链接中也有安装过程,可以参考。

也可以直接进入文件夹,直接运行,差什么,安装什么(我比较喜欢这样,因为我之前pip可能已经安装过了某些包)。最好借助AI,报错直接复制给AI,让它给出建议。

python .\main.py

根据报错,差什么,安装什么 pip install ...

特别注意:我一直遇到的问题,安装使用GPU的包时:pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121 。安装的版本是2.5.1,因为自动适配我的CUDA Version: 12.9版本。

但是在安装pip install xformers 时,会卸载 torch,重新安装 torch 时,安装2.4.0。导致版本冲突,最终解决方案:

先:
pip install torch==2.4.0 torchvision==0.19.0 torchaudio==2.3.0 --index-url https://download.pytorch.org/whl/cu121 然后:
pip install xformers==0.0.27.post2

结果完美适配我的CUDA。
不使用 xformers 也能运行,内存占用也非常大。建议尽可能使用 xformers

检查一下:

import torch

print("CUDA 可用:", torch.cuda.is_available())
print("当前设备:", torch.cuda.get_device_name(0))
print("CUDA 版本:", torch.version.cuda)
print("cuDNN 版本:", torch.backends.cudnn.version())
运行:python .\gpu.py

CUDA 可用: True
当前设备: NVIDIA GeForce GTX 1080
CUDA 版本: 12.1
cuDNN 版本: 90100

二:安装ComfyUI Manager

https://github.com/Comfy-Org/ComfyUI-Manager

下载解压到文件夹 ComfyUI/custom_nodes/  中。然后重新启动ComfyUI:python  main.py。

如果报错,差什么,安装什么。

三:安装节点

1:下载ComfyUI-DynamiCrafterWrapper

https://github.com/kijai/ComfyUI-DynamiCrafterWrapper

下载解压到文件夹ComfyUI/custom_nodes/  中。

2:模型下载:https://huggingface.co/Kijai/DynamiCrafter_pruned/tree/main

模型文件下载到文件夹\ComfyUI\models\checkpoints\ 中:

3: 然后重新启动ComfyUI:python  main.py。如果报错,差什么,安装什么。

四:启动服务ComfyUI:python  main.py

浏览器访问链接:

1:运行模型。这里可以自己研究添加节点,也可以直接使用DynamiCrafterWrapper提供的节点json(优先使用json)。json位置在 \ComfyUI\custom_nodes\ComfyUI-DynamiCrafterWrapper\examples,我使用的是dynamicrafter_i2v_example_01.json。

将这个json文件拖拽到浏览器中,这个时候ComfyUI Manager会自动检查是否需要安装其他插件,直接点击安装就行。

视频生成完成后,在文件夹 \ComfyUI\output\ 中。

 

 

2:注意选择的模型,越高档的模型占用CPU越大,选择的视频时间越长,占用GPU越大。

我的电脑GPU是专用8G,共享16G(可以不考虑,主要是专用GPU大小),这个配置一张图片生成视频(图片:914k,尺寸:576*1204,生成的视频3M,4s,8帧/s,尺寸576*1024),模型选择dynamicrafter_512。

一运行,GPU就100%,结果跑了一晚上才成功。

如果GPU小,可以选择更小的模型,DynamiCrafter256。图片也可以选小点的,生成的图片数调整小点。

三:总结

这种视频大模型要在本地运行,那本地机器必须是很强大才行,不然根本运行不动,那更不用说使用了。

后面再研究本地搭建图片+音频对嘴生成视频的AI.

搭建一个图片变视频的AI(二):开始搭建的更多相关文章

  1. Prism for WPF 搭建一个简单的模块化开发框架(二)

    原文:Prism for WPF 搭建一个简单的模块化开发框架(二) 今天又有时间了,再改改,加了一些控件全局的样式 样式代码 <ResourceDictionary xmlns="h ...

  2. 跟我一起使用electron搭建一个文件浏览器应用吧(二)

    这个文件浏览器应用可以具备以下两种功能噢- This file browser application can have the following two functions. 一:用户浏览文件夹和 ...

  3. 使用multer搭建一个图片接收服务器

    为了测试图片上传插件的上传功能是否好用,最近尝试搭建了一个接收图片的服务器,因为图片上传的编码格式是form-data,所以我选择使用express+multer,实现过程中发现有几个需要注意的地方, ...

  4. node环境使用multer搭建一个图片接收服务器

    为了测试图片上传插件的上传功能是否好用,最近尝试搭建了一个接收图片的服务器,因为图片上传的编码格式是form-data,所以我选择使用express+multer,实现过程中发现有几个需要注意的地方, ...

  5. 使用Hexo搭建一个简单的博客(二)

    昨天想着用Hexo和github搭一个自己简单的博客,记录一下自己踩过的坑,具体的流程就不重复了,主要参考了一下几篇文章 GitHub+Hexo 搭建个人网站详细教程 使用Hexo+Github一步步 ...

  6. 【VIP视频网站项目二】搭建爱奇艺优酷腾讯视频官网首页轮播图效果及实现原理分析

    这个是实现的效果,基本上轮播效果和主流网站的一致,但是我也在上面优化了一些效果, 可以在线预览效果:https://vip.52tech.tech/ 目前项目代码已经全部开源:项目地址:https:/ ...

  7. Django1.8教程——从零开始搭建一个完整django博客(二)

    在上一节中,我们已经创建了一个Django模型Post,并使Post模型与数据库同步.这一节中,我们将介绍Django管理站点,通过Django管理站点来管理我们创建的Post模型实例. 为你的模型创 ...

  8. 跟我一起用node-express搭建一个小项目(mongodb)[二]

    我的小项目主要是会用到MongoDB. 呵呵,我也是现学现卖. 都说小公司十八般武艺样样稀疏,没有办法啊! 兵来兵挡,将来将挡!自己是个兵呢?还是一个将呢! 没有公司培养,就自己培养自己呗.差的远一点 ...

  9. 如何使用 Gin 和 Gorm 搭建一个简单的 API 服务 (二)

    创建 API   我们之前已经跑过 Gin 框架的代码,现在是时候加些功能进去了. 读取全部信息   我们先从"增删改查"中的"查"入手,查询我们之前添加的信息.我接下来要删除几行代码,并把 Gin ...

  10. 从零开始用 Flask 搭建一个网站(二)

    从零开始用 Flask 搭建一个网站(一) 介绍了如何搭建 Python 环境,以及 Flask 应用基本项目结构.我们要搭建的网站是管理第三方集成的控制台,类似于 Slack. 本篇主要讲解数据如何 ...

随机推荐

  1. Java的IO模型、Netty原理详解

    1.什么是IO 虽然作为Java开发程序员,很多都听过IO.NIO这些,但是很多人都没深入去了解这些内容. Java的I/O是以流的方式进行数据输入输出的,Java的类库涉及很多领域的IO内容:标准的 ...

  2. Model接口

    /** * Model接口 * 作用:将值存放到request对象 * * * @return */ @RequestMapping(value = "/testModle") p ...

  3. 🎀dubbo QOS介绍及命令

    简介 在Dubbo中,QoS(Quality of Service)功能是一个非常重要的特性,用于提供对运行时服务的查询和控制能力. QoS的概念源自网络设备中的服务质量保障机制,但在Dubbo中,它 ...

  4. VMware平台的Ubuntu部署完全分布式Hadoop环境

    前言: 此文章是本人初次部署Hadoop的过程记录以及所遇到的问题解决,这篇文章只有实际操作部分,没有理论部分.因本人水平有限,本文难免存在不足的地方,如果您有建议,欢迎留言或私信告知于我,非常感谢. ...

  5. 康谋分享 | 直面AD/ADAS快速开发挑战:IVEX自动驾驶场景管理及分析平台!

    过去十年,自动驾驶和高级驾驶辅助系统 (AD/ADAS) 软件和硬件的开发成为了各大汽车公司的主要投资目标之一.各大汽车公司对 AD/ADAS 持续不断的投资加快了 AD/ADAS 组件的开发周期,但 ...

  6. 如何基于 Kestrel 实现 socks5 代理

    前言 之前做了个轮子NZOrz, 本来打算慢慢参照Kestrel和Yarp长久地写着玩 奈何川普上台,关税,订婚案,自身和钱包等等各种乐子层出不穷,无暇慢悠悠地写轮子玩 还有有些盆友也想知道能否直接使 ...

  7. Dubbo实战:四步实现注册中心平滑迁移原创

      写在前面 如题,这是一个真实存在的业务场景.在微服务体系的迭代过程中,会存在注册中心的切换,典型如从zookeeper迁移到nacos. 最近面试中,经常会用该场景来考察候选人(涉及RPC.分布式 ...

  8. SQL 日常练习 (十七)

    五一了, 2020过去近乎一半了, 疫情原因, 哪都没去, 其实与其出去玩, 不如呆着学习, 终身学习, 学无止境, 气有浩然, 这是我从上大学开始一直刻在脑海的训诫. 都说今年很艰难, 回头一想, ...

  9. C#开发的Panel滚动分页控件 - 开源研究系列文章

    前些时候因为想拥有一个自己的软件快捷打开软件,于是参考Windows 11的开始菜单,进行了编写这个应用软件,里面有一个功能就是对显示的Panel里的应用对象的分页功能,于是就想写一个对Panel的自 ...

  10. useEffect的那些坑,你知道多少

    @charset "UTF-8"; .markdown-body { line-height: 1.75; font-weight: 400; font-size: 14px; o ...