很多平台都会禁止用户使用带有网址或者二维码的头像以及文章配图,这样可以有效的防止用户的一些“导流”行为。当然,头像、文章或者视频现在都是AI来审,毕竟现在人工的成本实在太高,但是如果我们把文字元素直接融入图像或者视频之中,如此一来,AI也会很难识别出一些“导流”的元素。

本次我们依靠PIKA-labs平台,无需本地环境,直接简单粗暴输出带有文字元素的光影视频效果,基于Python3.10。

文字/图片生成视频

首先通过Discord平台订阅PIKA频道,频道地址:https://discord.com/channels/1123665496148017235

目前有两种方式来生成AI视频,分别是文字生成视频和图片生成视频:

在对话框内输入 /encrypt_text 我们就可以通过描述词来生成对应的AI视频。

主要参数为想要嵌入的文本(Message)以及提示词(Prompt):

比如我们输入:

/encrypt_text Message:v3u.cn Prompt:colorful paints

意思是生成一段视频,包含v3u.cn的文本,并且主题是彩色绘画。

生成的视频如下:

如果对效果不满意,也可以通过其他参数来进行微调,比如 -w 为权重,阈值范围是0-2,可以动态调整文本内容的权重,-font 参数可以对文本的字体进行调整。

比如我们生成一个油画风格的,权重略低,防止被审核识别出来的LOGO:

/encrypt_text Message:v3u.cn Prompt:Oil painting -w 1

效果如下:

除此之外,也可以通过/encrypt_image命令直接上传Logo图像来进行生成操作。

基于Python3.10

如果不想每次都登录Discord平台,我们也可也通过Pyhon命令行来进行生成,首先确保本地安装好Python3.10版本的开发环境,随后安装Discord库:

pip3 install -U discord.py

随后编写Discord登录代码:

import discord  

class MyClient(discord.Client):
async def on_ready(self):
print('Logged on as', self.user) async def on_message(self, message):
# don't respond to ourselves
if message.author == self.user:
return if message.content == 'ping':
await message.channel.send('pong') intents = discord.Intents.default()
intents.message_content = True
client = MyClient(intents=intents) client.run('您的discord token')

这里我们构建了一个客户端类,一旦链接成功就会触发异步方法on_ready输出当前登录的用户,注意这就是订阅了pika频道的用户,而不是机器人,程序输出:

2023-10-07 12:36:44 INFO     discord.client logging in using static token
Logged on as , v3ucn

Discord平台的用户token可以通过浏览器的开发者模式进行抓包获取,这里不再赘述。

如果登录成功,我们就可以通过客户端给当前订阅的频道发消息了,改写异步方法on_ready:

@client.event
async def on_ready(): # Called when internal cache is loaded
channel = client.get_channel(1134375457236725770) # Gets channel from internal cache
await channel.send("/encrypt_text Message:v3u.cn Prompt:Oil painting -w 1") # Sends message to channel

这里通过get_channel方法来获取订阅的频道,1134375457236725770是pika-labs的频道id,随后通过send方法直接发送即可。

结语

文字融入AI视频可以为创作者提供更多的艺术表达形式。通过巧妙运用文字的排版、动画效果和视觉设计,可以创造出独特的艺术风格和视觉冲击力,使得作品更具创意和吸引力,当然了,相应的,也为平台的审核系统创造了新的挑战。

AIGC革新,将文字或者LOGO融入AI视频基于PIKA-labs(Python3.10)的更多相关文章

  1. 闻其声而知雅意,基于Pytorch(mps/cpu/cuda)的人工智能AI本地语音识别库Whisper(Python3.10)

    前文回溯,之前一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),利用AI技术将文本合成语音,现在反过来,利用开源库Whisper再将语音转 ...

  2. 人工智能AI图像风格迁移(StyleTransfer),基于双层ControlNet(Python3.10)

    图像风格迁移(Style Transfer)是一种计算机视觉技术,旨在将一幅图像的风格应用到另一幅图像上,从而生成一幅新图像,该新图像结合了两幅原始图像的特点,目的是达到一种风格化叠加的效果,本次我们 ...

  3. 登峰造极,师出造化,Pytorch人工智能AI图像增强框架ControlNet绘画实践,基于Python3.10

    人工智能太疯狂,传统劳动力和内容创作平台被AI枪毙,弃尸尘埃.并非空穴来风,也不是危言耸听,人工智能AI图像增强框架ControlNet正在疯狂地改写绘画艺术的发展进程,你问我绘画行业未来的样子?我只 ...

  4. 人工智能,丹青圣手,全平台(原生/Docker)构建Stable-Diffusion-Webui的AI绘画库教程(Python3.10/Pytorch1.13.0)

    世间无限丹青手,遇上AI画不成.最近一段时间,可能所有人类画师都得发出一句"既生瑜,何生亮"的感叹,因为AI 绘画通用算法Stable Diffusion已然超神,无需美术基础,也 ...

  5. 笔精墨妙,妙手丹青,微软开源可视化版本的ChatGPT:Visual ChatGPT,人工智能AI聊天发图片,Python3.10实现

    说时迟那时快,微软第一时间发布开源库Visual ChatGPT,把 ChatGPT 的人工智能AI能力和Stable Diffusion以及ControlNet进行了整合.常常被互联网人挂在嘴边的& ...

  6. WPF中制作立体效果的文字或LOGO图形(续)

    原文:WPF中制作立体效果的文字或LOGO图形(续) 上篇"WPF中制作立体效果的文字或LOGO图形"(http://blog.csdn.net/johnsuna/archive/ ...

  7. WPF中制作立体效果的文字或LOGO图形

    原文:WPF中制作立体效果的文字或LOGO图形 较久之前,我曾写过一篇:"WPF绘制党徽(立体效果,Cool) "的博文.有感兴趣的朋友来EMAIL问是怎么制作的?本文解决此类问题 ...

  8. 浅谈AI视频技术超分辨率

    泛娱乐应用成为主流,社交与互动性强是共性,而具备这些特性的产品往往都集中在直播.短视频.图片分享社区等社交化娱乐产品,而在这些产品背后的黑科技持续成为关注重点,网易云信在网易MCtalk 泛娱乐创新峰 ...

  9. 吾剑未尝不利,国内Azure平替,科大讯飞人工智能免费AI语音合成(TTS)服务Python3.10接入

    微软Azure平台的语音合成(TTS)技术确实神乎其技,这一点在之前的一篇:含辞未吐,声若幽兰,史上最强免费人工智能AI语音合成TTS服务微软Azure(Python3.10接入),已经做过详细介绍, ...

  10. 顺应潮流,解放双手,让ChatGPT不废话直接帮忙编写可融入业务可运行的程序代码(Python3.10实现)

    众所周知,ChatGPT可以帮助研发人员编写或者Debug程序代码,但是在执行过程中,ChatGPT会将程序代码的一些相关文字解释和代码段混合着返回,如此,研发人员还需要自己进行编辑和粘贴操作,效率上 ...

随机推荐

  1. Go语言中的结构体:灵活性与可扩展性的重要角色

    1. 引言 结构体是Go语言中重要且灵活的概念之一.结构体的使用使得我们可以定义自己的数据类型,并将不同类型的字段组合在一起,实现更灵活的数据结构.本文旨在深入介绍Go语言中的结构体,揭示其重要性和灵 ...

  2. #PowerBi Superchange PowerBi 序言部分笔记(2)

    Xmind本文思维导图 序言部分,主要讲述了BI的分类及发展,以及作者推荐的学习方法.重点是介绍了powerbi的主要四大步骤. 即: 一:数据采集 Data acquisition: Power B ...

  3. Instruments中常用Template的使用

     Instruments是苹果提供的Xcode套件,可用于分析iOS,MacOS程序的性能数据,进行性能提升.Instruments提供了很多类型的Template,用于特定场景的分析.这里选了3种常 ...

  4. 前端自定义弹框组件、自定义弹框内容alertView popup组件

    快速实现前端自定义弹框.自定义弹框内容alertView popup组件, 请访问uni-app插件市场地址:https://ext.dcloud.net.cn/plugin?id=12491 效果图 ...

  5. Pinot2的无人机创新和发展

    目录 1. 引言 2. 技术原理及概念 2.1 基本概念解释 2.2 技术原理介绍 2.3 相关技术比较 3. 实现步骤与流程 3.1 准备工作:环境配置与依赖安装 3.2 核心模块实现 3.3 集成 ...

  6. LLM技术在自然语言处理中的实践与改进

    目录 <LLM技术在自然语言处理中的实践与改进> 引言 自然语言处理 (NLP) 是人工智能领域的一个重要分支,它研究如何将计算机程序与人类语言进行交互,从而理解.分析.生成和翻译文本.近 ...

  7. Java判断101-200之间有多少个素数,并输出所有素数。

    代码如下: public static void main(String[] args) { //记录个数 int count = 0; //循环遍历 for(int i = 101;i <= ...

  8. 10/29/2017_C语言_三道题

    1. 用标准C编程:找出整形数字1-100之间的素数,并打印出来.(素数:除了1和自己本身可以被整除.) 2. 用标准C编程:有两个整形变量m.n,求出这两个数的最小公倍数. 3. 用标准C编程:输出 ...

  9. 跟运维学 Linux - 02

    文件操作和用户 复制移动和删除 在Windows中我们可以通过快捷键 ctrl + c 复制,ctrl + v 粘贴,在 linux 中需要使用命令. 复制移动 cp 就是 copy 的意思.请看示例 ...

  10. [windows]远程桌面失败提示CredSSP加密修正

    前言 windows远程桌面失败,提示"CredSSP加密--" 远程桌面服务器的系统版本:Windows Server 2016 本地电脑的系统版本:Windows 10 方式1 ...