之前已经介绍过图片对嘴生成视频的开源工具:

DICE-Talkhttps://www.cnblogs.com/cj8988/p/18957718   (带表情,比较慢)

ComfyUI_Sonichttps://www.cnblogs.com/cj8988/p/18952604 (基础版)

本章在介绍一个图片生成对嘴视频的开源框架,带表情,生成比较快的。

float : https://github.com/deepbrainai-research/float

我这里使用集合ComfyUI版本:https://github.com/yuvraj108c/ComfyUI-FLOAT

一:下载源码

地址:https://github.com/yuvraj108c/ComfyUI-FLOAT

下载到指定目录:\ComfyUI\custom_nodes\

二:下载模型

地址:https://huggingface.co/yuvraj108c/float/tree/main

下载到指定目录:\ComfyUI\models\float\

三:安装插件

cd ./ComfyUI-FLOAT
pip install -r requirements.txt

四:运行

python  main.py

运行成功后,浏览器访问
http://127.0.0.1:8188/

然后将模板文件json拖拽进去:\ComfyUI\custom_nodes\ComfyUI-FLOAT\float_workflow.json

五:使用

上传一张图片,和一段音频,很快就生成了一个视频。图片必须是512*512尺寸的,其他尺寸都会被裁剪。

比较一下:

特性 ComfyUI_Sonic (新一代) ComfyUI-FLOAT (上一代) 优胜者 & 原因
核心技术 与语言无关 (Language-Agnostic)。直接从音频波形提取特征 (HuBERT),驱动面部运动。 依赖于特定语言的ASR。将语音转为音素,再由音素驱动嘴唇。  Sonic: 先进的技术路线,使其天生支持任何语言。
中文支持  完美支持。无需任何修改,直接输入中文音频即可。  支持。其核心模块是为英语设计的,如果是中文,表情方面处理不好。  Sonic: 这是最关键的区别,Sonic 开箱即用。
生成速度  极快 (接近实时)。模型轻量、高效。  较慢。涉及多个串联的、较重的模型,流程更长。  Sonic: 效率上是碾压性的优势。
口型精度  非常高。能够捕捉细微的发音,口型清晰、准确。  一般。基于音素的生成方式有时会产生“平均嘴型”,不够精细。  Sonic: 口型同步的质量更高。
资源占用 (VRAM)  较低。对硬件更友好。  较高。需要同时加载多个模型。  Sonic: 更适合大众用户的硬件配置。
头部姿态 头部基本静止。 头部会动,但是尺寸会裁剪为512*512。  平手: 两者默认都不生成头部运动。
面部表情 主要驱动口周区域,表情变化有限。  有专门的情感识别模块,可以驱动眉毛等表情。  FLOAT: 这是 FLOAT 理论上的唯一优势,但受限于其只支持英文。
安装与配置 简单,通过 ComfyUI Manager 一键安装,模型依赖清晰。 复杂,模型依赖多且容易出错(正如你遇到的问题)。  Sonic: 用户体验更好,更不容易出问题。
Float Sonic
抱歉,您的浏览器不支持内嵌视频。 抱歉,您的浏览器不支持内嵌视频。

图片生成对嘴视频FLOAT的更多相关文章

  1. 基础学习笔记之opencv(6):实现将图片生成视频

    基础学习笔记之opencv(6):实现将图片生成视频 在做实验的过程中.难免会读视频中的图片用来处理,相反将处理好的图片又整理输出为一个视频文件也是非经常常使用的. 以下就来讲讲基于opencv的C+ ...

  2. 最简单的基于FFmpeg的libswscale的示例附件:测试图片生成工具

    ===================================================== 最简单的基于FFmpeg的libswscale的示例系列文章列表: 最简单的基于FFmpeg ...

  3. OpenCV人脸检测并把图片写成avi视频

    读出某一个文件夹下“jpg”后缀的全部图片后,用的OpenCV自带的人脸检测检测图片中的人脸,调整图片的大小写成一个avi视频. 主要是要记录一下CvVideoWriter的用法和如何从文件夹中读取某 ...

  4. 【小工具系列】Python + OpenCV 图片序列转换成视频

    图片序列转换成视频 最近一直在找一个工具,能够将一堆图片转化成视频.网上找了一些小软件,还有 win10 的照片自带的视频制作功能,都不是很满意. 又不想下载那些专业的视频剪辑软件大材小用. 然后找到 ...

  5. CSS3鼠标移入移出图片生成随机动画

    今天分享使用html+css3+少量jquery实现鼠标移入移出图片生成随机动画,我们先看最终效果图(截图为静态效果,做出来可是动态的哟) 左右旋转 上下移动 缩放 由于时间关系我就不一步步解析各段代 ...

  6. Android长方形图片生成正圆形,以及矩形图片生成圆角

    一般要做正圆形图片,只能是正方形的基础上才能实现,否则就变成椭圆了,下面说说如何使长方形的图片生成正圆形图片 废话不多说,没图没真相,先上图吧: 原图:  变成正圆后:  下面上代码: public ...

  7. 富文本编辑器UEditor自定义工具栏(二、插入图片、音频、视频个性化功能按钮和弹层及自定义分页符)

    导读:本篇将简单探讨插入图片.音频.视频的功能按钮实现方式 传送门:富文本编辑器UEditor自定义工具栏(一.基础配置与字体.背景色.行间距.超链接实现) 一.效果图 1.UEditor自定义工具栏 ...

  8. HTML5:图片、音乐和视频

    图片.音乐和视频 一.图片 1.属性 属性 说明 alt 规定图像的替代文本. src 规定显示图像的 URL align 规定如何根据周围的文本来排列图像. border 定义图像周围的边框. he ...

  9. matlab下将图片序列转化为视频文件 && 将为视频文件转化图片序列

    将图片序列转化为视频文件 程序如下: framesPath = 'E:\img\';%图像序列所在路径,同时要保证图像大小相同 videoName = 'Bolt.avi';%表示将要创建的视频文件的 ...

  10. thinkphp3.2与phpexcel带图片生成 完美案例

    thinkphp3.2与phpexcel完美案例 // 导出exl public function look_down(){ $id = I('get.id'); $m = M ('offer_goo ...

随机推荐

  1. javaWeb之路径

    一. 路径写法: 1. 路径分类 a. 相对路径:通过相对路径不可以确定唯一资源 * 如:./index.html * 不以/开头,以.开头路径 * 规则:找到当前资源和目标资源之间的相对位置关系 * ...

  2. 🎀idea-java序列化serialversionUID自动生成

    简介 java.io.Serializable 是 Java 中的一个标记接口(marker interface),它没有任何方法或字段.当一个类实现了 Serializable 接口,那么这个类的对 ...

  3. zookeeper选主测试

    Zookeeper 会维护一个具有层次关系的数据结构,它非常类似于一个标准的文件系统 zookeeper基于目录监听机制来选主,多个客户端节点都可以来对zookeeper上某个目录节点进行监听和注册, ...

  4. js录制系统/麦克风声音(基于electron)

    最近想用electron写一个和音视频相关的软件,尽管在写之前都想好了要用哪些技术,但依然写得很艰难,今天对相关知识的个人理解做个记录和整理. 时隔半年,最近发现网上有大神造好的轮子,而且功能强大:h ...

  5. 拿来即用的下载Excel模板

    模板导出 拿来即用 @PostMapping("/templateExport") @ApiOperation(value = "模板导出", notes = ...

  6. hadoop部署安装(四)KAFKA+SCALA

    3.8 配置scala 下载,解压 wget https://downloads.lightbend.com/scala/2.13.0-M5/scala-2.13.0-M5.tgz tar -zxvf ...

  7. 开源的DeekWiki加入MCP,为您的Cursor提供开源项目分析,轻松让AI掌握开源项目使用文档!

    OpenDeekWiki加入MCP,为您的Cursor提供开源项目分析,轻松让AI掌握开源项目使用文档! OpenDeepWiki 是参考DeepWiki 作为灵感,基于 .NET 9 和 Seman ...

  8. JS函数调用的5种模式

    函数是经常会用的工具, 这里总结一下关于在 js 中的 5种函数调用的模式如下: <!DOCTYPE html> <html lang="en"> < ...

  9. .NET 8 开发的跨平台多商户第三方支付SDK

    前言 快速发展的互联网应用开发中,支付功能已成为各类平台不可或缺的一环.为了帮助大家更高效地接入主流支付渠道,推荐一套基于 .NET 开发的第三方支付 SDK.该 SDK 支持跨平台运行,适用于多种操 ...

  10. Data wrangling:Join,Combine,and Reshape,in Pandas

    Data wrangling:Join,Combine,and Reshape,in Pandas import pandas as pd import numpy as np Hierarchica ...