Buzz语音转文字安装使用(含Whisper模型下载)

https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672

简介：
Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper.
转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。
可以简单理解为QT的前端界面，python语言构建服务端，使用Whisper语言模型进行计算语音转文字的软件。
痛点在于离线，缺点也很明显，模型较大，高质量模型运算依赖于硬件和算法优化

应用场景
学习，歌曲提取歌词，视频提取字幕，多媒体信息前置数据提取

软件下载
从github上进行下载，下载地址https://github.com/chidiwilliams/buzz

百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d

软件安装
windows软件安装的常规流程，双击exe，选择安装路径，进行安装

软件使用
首先双击Buzz.exe，然后打开音频文件

第一执行翻译任务会在用户安装目录下载模型，如果是下载时间过长，Windows版本下载路径为：C:\Users<username>\AppData\Local\Buzz\Buzz\Cache ，表示用户目录，大概率会失败报错，这里可以使用离线的模型包

模型离线下载
百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d
下载完成后有五个类别的模型，大小和名字一样，越大效果越强，当然也取决于硬件，运算量越大，耗时越长

复制解压出来的模型，复制和替换C:\Users<username>\AppData\Local\Buzz\Buzz\Cache 下的模型

开始进行任务翻译任务处理

准确率和效率
上面视频用的Tiny模型，这个模型很小，所以翻译效果一般，但是用时也很短
实测使用Large(体积最大)模型翻译最准确，但是对硬件的图形运算能力要求很高，花费时间也最长

日志和耗时信息
Tiny 模型耗时
whisper process completed with code = 0, time taken = 0:01:24.168368, number of segments = 155
Large 模型耗时
whisper process completed with code = 0, time taken = 0:20:40.773737, number of segments = 214
————————————————
版权声明：本文为CSDN博主「JerryLXu」的原创文章，遵循CC 4.0 BY-SA版权协议，转载请附上原文出处链接及本声明。
原文链接：https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672

Buzz语音转文字安装使用(含Whisper模型下载)的更多相关文章

C# 语音识别（文字to语音、语音to文字）
最近打算研究一下语音识别,但是发现网上很少有C#的完整代码,就把自己的学习心得放上来,和大家分享一下. 下载API: 1)SpeechSDK51.exe (67.0 ...
机器人之路的第一小步：录音+语音识别(语音转文字)，大小600K(免费下载)！
机器人之路的第一小步:录音+语音识别(语音转文字),大小600K,本人出品! 机器人之路的第一小步:录音+语音识别,准确率还不是特别高,不过普通话标准的话,识别准确率还是不错的,大家可以体验一下,请下 ...
iOS 10中如何搭建一个语音转文字框架
在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...
[原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一) -- 安装jdk(含jre)及 MySql 5.6.39
[原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一) -- 安装jdk(含jre)及 MySql 5.6.39 回老家已经有一段时间了, 四五线 ...
iOS语音播报文字
记得大学的时候学微软Window Phone时,有语音识别类似苹果的嘿,Siri.今天无聊百度搜了一下,搜到苹果语音播报文字.自己试了下还挺好玩. 1.引入框架#import <AVFounda ...
语音识别系统：有免费实用的"语音到文字"的软件么？
自从看了<李开复自传>,就对"语音识别系统"产生了非常深刻的印象. 根据自己的判断,语音识别系统还是非常有用的. 以自己的实际需求来看: 1.中国象棋中的应用. 中国象 ...
Python使用websocket调用语音识别，语音转文字
@ 目录 0. 太长不看系列,直接使用 1. Python调用标贝科技语音识别websocket接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1 ...
手把手使用Python语音识别，进行语音转文字
0. 太长不看系列,直接使用在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_s ...
OpenAI Java SDK——chatgpt-java-v1.0.3更新支持GPT-3.5-Turbo，支持语音转文字，语音翻译。
简介 chatgpt-java是一个OpenAI的Java版SDK,支持开箱即用.目前以支持官网全部Api.支持最新版本GPT-3.5-Turbo模型以及whisper-1模型.增加chat聊天对话以 ...
MAC上反编译android apk---apktool, dex2jar, jd-jui安装使用(含手动签名)
前文介绍了在Windows平台利用强大的APK-Multi-Tool进行反编译apk,修改smali源码后再回编译成apk的流程,最近受人之托,破解个apk,所幸的是所用到的这三个软件都是跨平台的, ...

随机推荐

告别手动码字！AI智能生成+文档下载，职场/学习效率翻倍攻略！
一.写在前面本文重点介绍如何将AI智能生成文字直接转换为word文档,支持下载,最终提升大家学习和职场办公的效率. 二.实操环境 1.Pandoc-api服务: 下载地址:https://githu ...
详解鸿蒙Next仓颉开发语言中的全屏模式
大家好,今天跟大家分享一下仓颉开发语言中的全屏模式. 和ArkTS一样,仓颉的新建项目默认是非全屏模式的,如果你的应用颜色比较丰富,就会发现屏幕上方和底部的留白,这是应用自动避让了屏幕上方摄像头区域和 ...
Selenium框架
Selenium框架 Selenium是一个自动化测试工具,用于模拟用户在Web应用程序上的操作.它提供了多种编程语言的接口,如Python.Java等,使测试人员能够编写自动化测试脚本.Seleni ...
渗透中的逆向工具-jsrpc实操手记
前言在渗透测试过程中,有些网站的接口参数是加密的.对于逆向小菜鸡的我来说,遇到这种网站总是束手无策,不能修改其中的参数,也就无法进行下一步的测试.偶然间发现一款js逆向工具jsrpc,它可以直接调用 ...
python 安装的国内镜像源
Python 镜像源是指可以用来下载 Python 相关软件包的在线仓库地址.Python 在国内使用的比较广泛,为了提高安装包的下载速度,一般会配置国内镜像源.常见的 Python 镜像源包括以下几 ...
设置div 内容不会换行显示滚动条
overflow-x: scroll; display: inline-block; white-space: nowrap; 内容不能脱离文档流否则还是会把div 撑开
这几个 Vibe Coding 经验，真的建议学！
大家好,我是 Immerse,一名独立开发者.内容创作者.AGI 实践者. 关注公众号:#沉浸式趣谈,获取最新文章(更多内容只在公众号更新) 个人网站:https://yaolifeng.com 也同 ...
CF576A Vasya and Petyas Game 题解
CF576A Vasya and Petya's Game 数论思维题. 根据唯一分解定理,可以知道,如果一个数的各个质因数的数量确定了,这个数也就确定了. 每次询问的中,如果 \(x\) 是 \(y ...
Python 潮流周刊#110：JIT 编译器两年回顾，AI 智能体工具大爆发（摘要）
本周刊由 Python猫出品,精心筛选国内外的 400+ 信息源,为你挑选最值得分享的文章.教程.开源项目.软件工具.播客和视频.热门话题等内容.愿景:帮助所有读者精进 Python 技术,并增长职 ...
前端开发系列088-Node篇之url
本文对Node的内置模块url进行介绍,包括基本情况和简单使用. 一.模块的内容 url是Node的内置核心模块之一,无需单独安装可以直接在代码中通过var url = require("u ...

Buzz语音转文字安装使用(含Whisper模型下载)

Buzz语音转文字安装使用(含Whisper模型下载)的更多相关文章

随机推荐

热门专题