文生绘动 Agent:从词语到动态影像,言出即成,你的AI动画创作伙伴

1.一款由大型语言模型(LLM)驱动的动画引擎 agent 。

一款由大型语言模型(LLM)驱动的动画引擎 agent 。用户输入抽象概念或词语,雾象会将其转化为高水平的生动动画。

将雾象部署在本地后,您只需输入词语,点击生成,便可得到动画。设计了易用的语言用户界面(Language User Interface),用户也可以进一步轻松编辑或改进生成动画,做到言出法随

雾象,意为 “在模糊智能中的具象”雾象是 WaytoAGI 开源计划项目成员。 WaytoAGI, 让更多人因 AI 而强大

核心功能

  • 概念即影像: 输入一个主题,Fogsight 将为您生成一部叙事完整的高水平动画,包含双语旁白与电影级的视觉质感。
  • 智能编排: Fogsight 的核心是其强大的LLM驱动的编排能力。从旁白、视觉元素到动态效果,AI 将自动完成整个创作流程,一气呵成。
  • 语言用户界面 (LUI): 通过与 AI 的多轮对话,您可以对动画进行精准调优和迭代,直至达到您心中最理想的艺术效果。

动画示例

以下为 Fogsight AI 生成的动画示例

个人制作效果: (fork代码后可以看到效果,线上看效果)

视频效果放在文末

快速开始

环境要求

  • Python 3.9+
  • 一个现代网络浏览器 (如 Chrome, Firefox, Edge)
  • 大语言模型的 API 密钥。我们推荐您使用 Google Gemini 2.5。

安装与运行

快速上手

环境要求

  • Python 3.9+
  • 一个现代网络浏览器 (如 Chrome, Firefox, Edge)
  • 大语言模型的 API 密钥。我们推荐您使用 Google Gemini 2.5。

安装与运行

  1. 克隆代码仓库:

    git clone https://github.com/fogsightai/fogsight.git
    cd fogsight
  2. 安装依赖:

    pip install -r requirements.txt
  3. 配置API密钥:

    cp demo-credentials.json credentials.json
    # 复制 demo-credentials.json 文件并重命名为 credentials.json
    # 编辑 credentials.json 文件,填入您的 API_KEY 和 BASE_URL。
    # **请注意**,我们使用的是与 OpenAI 兼容的 SDK,但您仍应使用Gemini 2.5 pro
  4. 一键启动:

    python start_fogsight.py
    # 运行 start_fogsight.py 脚本
    # 它将自动启动后端服务并在浏览器中自动打开 http://127.0.0.1:8000
  5. 开始创作!

    在页面中输入一个主题(例如"冒泡排序"),然后等待结果生成。

Docker 方式运行

如果您更喜欢使用 Docker,可以按照以下步骤:

  1. 确保 Docker 已安装:

    请确保您的系统已安装 Docker 和 docker-compose。

  2. 克隆代码仓库:

    git clone https://github.com/fogsightai/fogsight.git
    cd fogsight
  3. 配置API密钥:

    cp demo-credentials.json credentials.json
    # 编辑 credentials.json 文件,填入您的 API_KEY、BASE_URL 和 MODEL # 使用 OpenRouter 的配置示例:
    # {
    # "API_KEY": "sk-or-v1-您的OpenRouter密钥",
    # "BASE_URL": "https://openrouter.ai/api/v1",
    # "MODEL": "anthropic/claude-sonnet-4"
    # } # 使用 Gemini 的配置示例:
    # {
    # "API_KEY": "您的Gemini密钥",
    # "BASE_URL": "",
    # "MODEL": "gemini-2.5-pro"
    # }
  4. 使用 Docker Compose 启动:

    # 使用默认端口 8000
    docker-compose up -d # 或者指定自定义端口(例如 3000)
    HOST_PORT=3000 docker-compose up -d

    如果 Docker 镜像无法拉取,可以尝试使用代理,或者使用镜像的国内源。

  5. 访问应用:

    打开浏览器访问 http://localhost:8000(或您指定的端口)

  6. 停止服务:

    docker-compose down

链接跳转

AI 动画链接

AI-Compass

AI-Compass 致力于构建最全面、最实用、最前沿的AI技术学习和实践生态,通过六大核心模块的系统化组织,为不同层次的学习者和开发者提供从完整学习路径。

如果本项目对您有所帮助,请为我们点亮一颗星!

核心模块架构:

  • 基础知识模块:涵盖AI导航工具、Prompt工程、LLM测评、语言模型、多模态模型等核心理论基础
  • ⚙️ 技术框架模块:包含Embedding模型、训练框架、推理部署、评估框架、RLHF等技术栈
  • 应用实践模块:聚焦RAG+workflow、Agent、GraphRAG、MCP+A2A等前沿应用架构
  • ️ 产品与工具模块:整合AI应用、AI产品、竞赛资源等实战内容
  • 企业开源模块:汇集华为、腾讯、阿里、百度飞桨、Datawhale等企业级开源资源
  • 社区与平台模块:提供学习平台、技术文章、社区论坛等生态资源

适用人群:

  • AI初学者:提供系统化的学习路径和基础知识体系,快速建立AI技术认知框架
  • 技术开发者:深度技术资源和工程实践指南,提升AI项目开发和部署能力
  • 产品经理:AI产品设计方法论和市场案例分析,掌握AI产品化策略
  • 研究人员:前沿技术趋势和学术资源,拓展AI应用研究边界
  • 企业团队:完整的AI技术选型和落地方案,加速企业AI转型进程
  • 求职者:全面的面试准备资源和项目实战经验,提升AI领域竞争力

视频

文生绘动 Agent:从词语到动态影像,言出即成,你的AI动画创作伙伴的更多相关文章

  1. 在Winform框架的多文档界面中实现双击子窗口单独弹出或拖出及拽回的处理

    在基于DevExpress的多文档窗口界面中,我们一般使用XtraTabbedMdiManager来管理多文档窗口的一些特性,如顶部菜单,页面的关闭按钮处理,以及一些特殊的设置,本篇随笔介绍这些特点, ...

  2. 最长回文子串(动规,中心扩散法,Manacher算法)

    题目 leetcode:5. Longest Palindromic Substring 解法 动态规划 时间复杂度\(O(n^2)\),空间复杂度\(O(n^2)\) 基本解法直接看代码 class ...

  3. 优动漫PAINT动画创作功能介绍

    优动漫PAINT也就是我们常说的clip studio paint(CSP)的中文版本,它是一款功能强大的漫画.插画绘制软件,它搭载了绘制漫画和插画所需的所有功能,包括丰富的笔工具.超强的笔压感应和手 ...

  4. Agent J(求三个圆围成的区域面积)

    A - A Time Limit:1000MS     Memory Limit:32768KB     64bit IO Format:%lld & %llu Submit Status P ...

  5. 使用2种python脚本工具将2个txt文档中的文字进行比较,并计算出Corr, WER正确率,准确率

    一.准备: linux服务器,src2mlf.py   rec2mlf.py   HResults文件,1份源文件和1份需要对比的文件.文件放置于本人云盘 二.使用方法: 1. 对比工具 HResul ...

  6. 高性能JavaScript 重排与重绘

    先回顾下前文高性能JavaScript DOM编程,主要提了两点优化,一是尽量减少DOM的访问,而把运算放在ECMAScript这一端,二是尽量缓存局部变量,比如length等等,最后介绍了两个新的A ...

  7. 高性能WEB开发:重排与重绘

    DOM编程可能最耗时的地方,重排和重绘. 1.什么是重排和重绘 浏览器下载完页面中的所有组件——HTML标记.JavaScript.CSS.图片之后会解析生成两个内部数据结构——DOM树和渲染树. D ...

  8. H5动效的常见制作手法

    众所周知,一个元素,动往往比静更吸引眼球: 一套操作界面,合适的动态交互反馈能给用户带来更好的操作体验: 一个H5运营宣传页,炫酷的动画特效定能助力传播和品牌打造. 近两年,小到loading动画,表 ...

  9. 浏览器渲染详细过程:重绘、重排和 composite 只是冰山一角

    https://juejin.im/entry/590801780ce46300617c89b8 渲染 这张很经典的图许多人都看过,其中的概念大家应该都很熟悉,也就是这么几个步骤:js修改dom结构或 ...

  10. js 重排和重绘

    1.什么是重排和重绘 浏览器下载完页面中的所有组件--HTML标记.JavaScript.CSS.图片之后会解析生成两个内部数据结构--DOM树和渲染树. DOM树表示页面结构,渲染树表示DOM节点如 ...

随机推荐

  1. 用装饰器简化大量if-elif代码

    源码地址:https://github.com/edgedb/edgedb/blob/master/edb/common/value_dispatch.py 鸣谢原文:一日一技:使用装饰器简化大量 i ...

  2. mac ssh 总是自动断开

    创建一个ssh配置文件: vi ~/.ssh/config 写入以下内容: Host * ServerAliveInterval 120 TCPKeepAlive no

  3. linux配置Maxwell

    1.Maxwell-1.30.0及以上的版本不再支持JDK1.8,而JDK1.8支持的最后一个版本为1.29.2 2.下载Maxwell的压缩包,上传到服务器并解压 3.tar -xf maxwell ...

  4. My Attitude

    不走捷径 长期主义者 选择成长,选择善良 The master has failed more times than the beginner has tried.

  5. 利用python、scipy求解差分方程的解

    文档:https://docs.scipy.org/doc/scipy/reference/generated/scipy.signal.lfilter.html#scipy.signal.lfilt ...

  6. K8s v1.31 新特性:ImageVolume,允许将镜像作为 Volume 进行挂载

    本文主要分享一个 K8s 1.31 增加的一个新 Feature:ImageVolume.允许直接将 OCI 镜像作为 Volume 进行挂载,加速 artifact 分发. 1.背景 Kuberne ...

  7. Apache Hudi 在袋鼠云数据湖平台的设计与实践

    在大数据处理中,实时数据分析是一个重要的需求.随着数据量的不断增长,对于实时分析的挑战也在不断加大,传统的批处理方式已经不能满足实时数据处理的需求,需要一种更加高效的技术来解决这个问题.Apache ...

  8. Java源码分析系列笔记-2.Synchronized

    目录 1. 是什么 2. 什么时候使用 2.1. 多线程访问共享资源时的并发问题 2.1.1. 究其原因 2.1.2. 解决的方法 3. 如何使用 3.1. 修饰 static 方法.使用的锁是当前类 ...

  9. HyperMesh基础教程:概述与有限元分析简介

    1.1 HyperMesh 概述 本节将介绍有限单元法基本原理,HyperMesh 软件基本功能及界面介绍,获取在线帮助等内容. 1.1.1 有限元分析方法简介 有限单元法(FEM)是一种可以精确预测 ...

  10. 4G CAT1模块的智慧农业远程监控案例

    1.行业背景 智慧农业是农业生产的高级阶段,是集新兴的互联网.移动互联网.云计算.边缘计算和物联网技术为一体,依托部署农业生产现场的各种传感节点(环境温湿度.土壤水分.二氧化碳.图像等)和无线通信网络 ...