之前已经介绍过图片对嘴生成视频的开源工具:

DICE-Talkhttps://www.cnblogs.com/cj8988/p/18957718   (带表情,比较慢)

ComfyUI_Sonichttps://www.cnblogs.com/cj8988/p/18952604 (基础版)

本章在介绍一个图片生成对嘴视频的开源框架,带表情,生成比较快的。

float : https://github.com/deepbrainai-research/float

我这里使用集合ComfyUI版本:https://github.com/yuvraj108c/ComfyUI-FLOAT

一:下载源码

地址:https://github.com/yuvraj108c/ComfyUI-FLOAT

下载到指定目录:\ComfyUI\custom_nodes\

二:下载模型

地址:https://huggingface.co/yuvraj108c/float/tree/main

下载到指定目录:\ComfyUI\models\float\

三:安装插件

cd ./ComfyUI-FLOAT
pip install -r requirements.txt

四:运行

python  main.py

运行成功后,浏览器访问
http://127.0.0.1:8188/

然后将模板文件json拖拽进去:\ComfyUI\custom_nodes\ComfyUI-FLOAT\float_workflow.json

五:使用

上传一张图片,和一段音频,很快就生成了一个视频。图片必须是512*512尺寸的,其他尺寸都会被裁剪。

比较一下:

特性 ComfyUI_Sonic (新一代) ComfyUI-FLOAT (上一代) 优胜者 & 原因
核心技术 与语言无关 (Language-Agnostic)。直接从音频波形提取特征 (HuBERT),驱动面部运动。 依赖于特定语言的ASR。将语音转为音素,再由音素驱动嘴唇。  Sonic: 先进的技术路线,使其天生支持任何语言。
中文支持  完美支持。无需任何修改,直接输入中文音频即可。  支持。其核心模块是为英语设计的,如果是中文,表情方面处理不好。  Sonic: 这是最关键的区别,Sonic 开箱即用。
生成速度  极快 (接近实时)。模型轻量、高效。  较慢。涉及多个串联的、较重的模型,流程更长。  Sonic: 效率上是碾压性的优势。
口型精度  非常高。能够捕捉细微的发音,口型清晰、准确。  一般。基于音素的生成方式有时会产生“平均嘴型”,不够精细。  Sonic: 口型同步的质量更高。
资源占用 (VRAM)  较低。对硬件更友好。  较高。需要同时加载多个模型。  Sonic: 更适合大众用户的硬件配置。
头部姿态 头部基本静止。 头部会动,但是尺寸会裁剪为512*512。  平手: 两者默认都不生成头部运动。
面部表情 主要驱动口周区域,表情变化有限。  有专门的情感识别模块,可以驱动眉毛等表情。  FLOAT: 这是 FLOAT 理论上的唯一优势,但受限于其只支持英文。
安装与配置 简单,通过 ComfyUI Manager 一键安装,模型依赖清晰。 复杂,模型依赖多且容易出错(正如你遇到的问题)。  Sonic: 用户体验更好,更不容易出问题。
Float Sonic
抱歉,您的浏览器不支持内嵌视频。 抱歉,您的浏览器不支持内嵌视频。

图片生成对嘴视频FLOAT的更多相关文章

  1. 基础学习笔记之opencv(6):实现将图片生成视频

    基础学习笔记之opencv(6):实现将图片生成视频 在做实验的过程中.难免会读视频中的图片用来处理,相反将处理好的图片又整理输出为一个视频文件也是非经常常使用的. 以下就来讲讲基于opencv的C+ ...

  2. 最简单的基于FFmpeg的libswscale的示例附件:测试图片生成工具

    ===================================================== 最简单的基于FFmpeg的libswscale的示例系列文章列表: 最简单的基于FFmpeg ...

  3. OpenCV人脸检测并把图片写成avi视频

    读出某一个文件夹下“jpg”后缀的全部图片后,用的OpenCV自带的人脸检测检测图片中的人脸,调整图片的大小写成一个avi视频. 主要是要记录一下CvVideoWriter的用法和如何从文件夹中读取某 ...

  4. 【小工具系列】Python + OpenCV 图片序列转换成视频

    图片序列转换成视频 最近一直在找一个工具,能够将一堆图片转化成视频.网上找了一些小软件,还有 win10 的照片自带的视频制作功能,都不是很满意. 又不想下载那些专业的视频剪辑软件大材小用. 然后找到 ...

  5. CSS3鼠标移入移出图片生成随机动画

    今天分享使用html+css3+少量jquery实现鼠标移入移出图片生成随机动画,我们先看最终效果图(截图为静态效果,做出来可是动态的哟) 左右旋转 上下移动 缩放 由于时间关系我就不一步步解析各段代 ...

  6. Android长方形图片生成正圆形,以及矩形图片生成圆角

    一般要做正圆形图片,只能是正方形的基础上才能实现,否则就变成椭圆了,下面说说如何使长方形的图片生成正圆形图片 废话不多说,没图没真相,先上图吧: 原图:  变成正圆后:  下面上代码: public ...

  7. 富文本编辑器UEditor自定义工具栏(二、插入图片、音频、视频个性化功能按钮和弹层及自定义分页符)

    导读:本篇将简单探讨插入图片.音频.视频的功能按钮实现方式 传送门:富文本编辑器UEditor自定义工具栏(一.基础配置与字体.背景色.行间距.超链接实现) 一.效果图 1.UEditor自定义工具栏 ...

  8. HTML5:图片、音乐和视频

    图片.音乐和视频 一.图片 1.属性 属性 说明 alt 规定图像的替代文本. src 规定显示图像的 URL align 规定如何根据周围的文本来排列图像. border 定义图像周围的边框. he ...

  9. matlab下将图片序列转化为视频文件 && 将为视频文件转化图片序列

    将图片序列转化为视频文件 程序如下: framesPath = 'E:\img\';%图像序列所在路径,同时要保证图像大小相同 videoName = 'Bolt.avi';%表示将要创建的视频文件的 ...

  10. thinkphp3.2与phpexcel带图片生成 完美案例

    thinkphp3.2与phpexcel完美案例 // 导出exl public function look_down(){ $id = I('get.id'); $m = M ('offer_goo ...

随机推荐

  1. SpringMVC处理请求源码分析

    一.先从Servlet案例说起 1.编写Servlet代码 2.配置web.xml(可选) 二.从DispatcherServlet说起 有Servlet基础的同学应该都知道,前端的每一个请求都会由一 ...

  2. springboot整合log4j

    一.默认名log4j2-spring.xml,就省下了在application.yml中配置 <console name="Console" target="SYS ...

  3. 魔方求解器桌面版(层先法,基于Tauri实现)

    开发了一个桌面版的三阶魔方求解器,代码地址:https://github.com/davelet/rubik-cube-restore/pull/2 .欢迎使用. 一.层先法求解 代码逻辑是从前面的j ...

  4. sonarqube+gitlab+jenkins+maven集成搭建(三)

    安装JENKINS 关闭防火墙[root@localhost ~]# systemctl stop firewalld[root@localhost ~]# systemctl disable fir ...

  5. <HarmonyOS第一课04>应用程序框架基础

    视频链接: https://developer.huawei.com/consumer/cn/training/course/slightMooc/C101717497122909477?ha_sou ...

  6. K8s新手系列之ReplicationController资源

    概述 官网地址:https://kubernetes.io/zh-cn/docs/concepts/workloads/controllers/replicationcontroller/ Repli ...

  7. 关于HarmonyOS NEXT中的模块化开发

    今天不写页面和动画,斗胆给大家讲一讲软件工程. 软件工程讲究高内聚低耦合,意思就是把整个工程按照分工不同分成不同的模块,每一个模块紧密联系又互不影响.就像一座摩天大楼,它里面的电路网非常庞大和复杂,它 ...

  8. Flutter适配HarmonyOS 5开发知识地图

    还在为Flutter适配HarmonyOS 5头疼?这份知识地图,用实战解析+高频避坑指南,帮你快速打通跨平台开发任督二脉! ▌为什么这份资源值得你收藏? 分层进阶:从环境搭建→插件开发→性能优化,匹 ...

  9. 国际化利器 Intl Messageformat

    我们是袋鼠云数栈 UED 团队,致力于打造优秀的一站式数据中台产品.我们始终保持工匠精神,探索前端道路,为社区积累并传播经验价值. 本文作者:霜序 Formats ICU Message string ...

  10. vue3 基础-non-props 特性

    本篇探讨当父组件通过属性给子组件传数据时, 子组件如果不通过 props 属性进行接收, 那数据会挂载到哪里, 以及子组件如何能使用这些数据. 正常的父子组件传值 <!DOCTYPE html& ...