Buzz语音转文字安装使用(含Whisper模型下载)
https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672
简介:
Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper.
转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。
可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。
痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化
应用场景
学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取
软件下载
从github上进行下载,下载地址https://github.com/chidiwilliams/buzz
百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d
软件安装
windows软件安装的常规流程,双击exe,选择安装路径,进行安装
软件使用
首先双击Buzz.exe,然后打开音频文件
第一执行翻译任务会在用户安装目录下载模型,如果是下载时间过长,Windows版本下载路径为:C:\Users<username>\AppData\Local\Buzz\Buzz\Cache ,表示用户目录,大概率会失败报错,这里可以使用离线的模型包
模型离线下载
百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d
下载完成后有五个类别的模型,大小和名字一样,越大效果越强,当然也取决于硬件,运算量越大,耗时越长
复制解压出来的模型,复制和替换C:\Users<username>\AppData\Local\Buzz\Buzz\Cache 下的模型
开始进行任务翻译任务处理
准确率和效率
上面视频用的Tiny模型,这个模型很小,所以翻译效果一般,但是用时也很短
实测使用Large(体积最大)模型翻译最准确,但是对硬件的图形运算能力要求很高,花费时间也最长
日志和耗时信息
Tiny 模型耗时
whisper process completed with code = 0, time taken = 0:01:24.168368, number of segments = 155
Large 模型耗时
whisper process completed with code = 0, time taken = 0:20:40.773737, number of segments = 214
————————————————
版权声明:本文为CSDN博主「JerryLXu」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672
Buzz语音转文字安装使用(含Whisper模型下载)的更多相关文章
- C# 语音识别(文字to语音、语音to文字)
最近打算研究一下语音识别,但是发现网上很少有C#的完整代码,就把自己的学习心得放上来,和大家分享一下. 下载API: 1)SpeechSDK51.exe (67.0 ...
- 机器人之路的第一小步:录音+语音识别(语音转文字),大小600K(免费下载)!
机器人之路的第一小步:录音+语音识别(语音转文字),大小600K,本人出品! 机器人之路的第一小步:录音+语音识别,准确率还不是特别高,不过普通话标准的话,识别准确率还是不错的,大家可以体验一下,请下 ...
- iOS 10中如何搭建一个语音转文字框架
在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...
- [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一) -- 安装jdk(含jre)及 MySql 5.6.39
[原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一) -- 安装jdk(含jre)及 MySql 5.6.39 回老家已经有一段时间了, 四五线 ...
- iOS语音播报文字
记得大学的时候学微软Window Phone时,有语音识别类似苹果的嘿,Siri.今天无聊百度搜了一下,搜到苹果语音播报文字.自己试了下还挺好玩. 1.引入框架#import <AVFounda ...
- 语音识别系统:有免费实用的"语音到文字"的软件么?
自从看了<李开复自传>,就对"语音识别系统"产生了非常深刻的印象. 根据自己的判断,语音识别系统还是非常有用的. 以自己的实际需求来看: 1.中国象棋中的应用. 中国象 ...
- Python使用websocket调用语音识别,语音转文字
@ 目录 0. 太长不看系列,直接使用 1. Python调用标贝科技语音识别websocket接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1 ...
- 手把手使用Python语音识别,进行语音转文字
0. 太长不看系列,直接使用 在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_s ...
- OpenAI Java SDK——chatgpt-java-v1.0.3更新支持GPT-3.5-Turbo,支持语音转文字,语音翻译。
简介 chatgpt-java是一个OpenAI的Java版SDK,支持开箱即用.目前以支持官网全部Api.支持最新版本GPT-3.5-Turbo模型以及whisper-1模型.增加chat聊天对话以 ...
- MAC上反编译android apk---apktool, dex2jar, jd-jui安装使用(含手动签名)
前文 介绍了在Windows平台利用强大的APK-Multi-Tool进行反编译apk,修改smali源码后再回编译成apk的流程,最近受人之托,破解个apk,所幸的是所用到的这三个软件都是跨平台的, ...
随机推荐
- 数组:ArrayList和int[]
需要好好复习一下: 数组ArrayList和int[ ] int[ ] 多可以使用Arrays工具类导入后 使用Arrays.xxx(arr) 实现很多功能
- 详细剖析|袋鼠云数栈前端框架Antd 3.x 升级 4.x 的踩坑之路
袋鼠云数栈从2016年发布第⼀个版本开始,就始终坚持着以技术为核⼼.安全为底线.提效为⽬标.中台为战略的思想,坚定不移地⾛国产化信创路线,不断推进产品功能迭代.技术创新.服务细化和性能升级. 在数栈过 ...
- Oracle 客户端深度指南:SQL Developer 与 PL/SQL Developer 全面安装使用教程
作为拥有10年Oracle开发经验的资深工程师,我将为您提供一份专业级的客户端工具指南.无论您是初学者还是进阶开发者,本教程都将帮助您高效使用Oracle生态中最强大的两个工具. 一.工具对比与选择建 ...
- 4G CAT1 DTU RS232/485转4G Modbus RTU转4G Modbus TCP RS232/485转MQTT DLT-645/RTU转云平台JSON
4G CAT1 DTU RS232/485转4G Modbus RTU转4G Modbus TCP RS232/485转MQTT DLT-645/RTU转云平台JSON 高性价比的CA ...
- 斐讯n1进入u盘启动
前言 我将n1刷完电视系统后,看了几天电视,发现还行吧. 过了几天,突然想玩游戏,发现插入u盘重启,依然进入电视,并不进入u盘的游戏机系统. 提供以下脚本,局域网下其他远程设备执行即可. window ...
- CentOS7 - 安装NextCloud
a { display: block } 首先安装LAMP环境 通过PhpMyAdmin,为NextCloud新建一个数据库.访问地址为 http://IP地址/phpmyadmin/ 下载最新版本的 ...
- 【HDU 1505】 City Game 单调栈
传送门 HDU-1505 题意:找到矩阵中的最大子矩阵(有些点为障碍物). 思路: 看到网上清一色的dp,我就写一下这个题的单调栈做法.其实这个题和HDU-1506这个题是基本一样的. 1.在1506 ...
- C++ STL 源码 阅读
简介 STL 最常用的源码 下载链接 https://github.com/steveLauwh/SGI-STL
- Markdown常用emoji表情
.emoji { width: 45px } #emojilist { margin: 0 auto; text-align: center } #emojilist li { float: left ...
- 从零开始实现简易版Netty(四) MyNetty 高效的数据写出实现
从零开始实现简易版Netty(四) MyNetty 高效的数据写出实现 1. MyNetty 数据写出处理优化 在上一篇博客中,lab3版本的MyNetty对事件循环中的IO读事件处理做了一定的优化, ...