https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672

简介:
Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper.
转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。
可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。
痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化

应用场景
学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取

软件下载
从github上进行下载,下载地址https://github.com/chidiwilliams/buzz

百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d

软件安装
windows软件安装的常规流程,双击exe,选择安装路径,进行安装

软件使用
首先双击Buzz.exe,然后打开音频文件

第一执行翻译任务会在用户安装目录下载模型,如果是下载时间过长,Windows版本下载路径为:C:\Users<username>\AppData\Local\Buzz\Buzz\Cache ,表示用户目录,大概率会失败报错,这里可以使用离线的模型包

模型离线下载
百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d
下载完成后有五个类别的模型,大小和名字一样,越大效果越强,当然也取决于硬件,运算量越大,耗时越长

复制解压出来的模型,复制和替换C:\Users<username>\AppData\Local\Buzz\Buzz\Cache 下的模型

开始进行任务翻译任务处理

准确率和效率
上面视频用的Tiny模型,这个模型很小,所以翻译效果一般,但是用时也很短
实测使用Large(体积最大)模型翻译最准确,但是对硬件的图形运算能力要求很高,花费时间也最长

日志和耗时信息
Tiny 模型耗时
whisper process completed with code = 0, time taken = 0:01:24.168368, number of segments = 155
Large 模型耗时
whisper process completed with code = 0, time taken = 0:20:40.773737, number of segments = 214
————————————————
版权声明:本文为CSDN博主「JerryLXu」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672

Buzz语音转文字安装使用(含Whisper模型下载)的更多相关文章

  1. C# 语音识别(文字to语音、语音to文字)

    最近打算研究一下语音识别,但是发现网上很少有C#的完整代码,就把自己的学习心得放上来,和大家分享一下. 下载API: 1)SpeechSDK51.exe                   (67.0 ...

  2. 机器人之路的第一小步:录音+语音识别(语音转文字),大小600K(免费下载)!

    机器人之路的第一小步:录音+语音识别(语音转文字),大小600K,本人出品! 机器人之路的第一小步:录音+语音识别,准确率还不是特别高,不过普通话标准的话,识别准确率还是不错的,大家可以体验一下,请下 ...

  3. iOS 10中如何搭建一个语音转文字框架

    在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...

  4. [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一) -- 安装jdk(含jre)及 MySql 5.6.39

    [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一)  --  安装jdk(含jre)及 MySql 5.6.39 回老家已经有一段时间了, 四五线 ...

  5. iOS语音播报文字

    记得大学的时候学微软Window Phone时,有语音识别类似苹果的嘿,Siri.今天无聊百度搜了一下,搜到苹果语音播报文字.自己试了下还挺好玩. 1.引入框架#import <AVFounda ...

  6. 语音识别系统:有免费实用的"语音到文字"的软件么?

    自从看了<李开复自传>,就对"语音识别系统"产生了非常深刻的印象. 根据自己的判断,语音识别系统还是非常有用的. 以自己的实际需求来看: 1.中国象棋中的应用. 中国象 ...

  7. Python使用websocket调用语音识别,语音转文字

    @ 目录 0. 太长不看系列,直接使用 1. Python调用标贝科技语音识别websocket接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1 ...

  8. 手把手使用Python语音识别,进行语音转文字

    0. 太长不看系列,直接使用 在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_s ...

  9. OpenAI Java SDK——chatgpt-java-v1.0.3更新支持GPT-3.5-Turbo,支持语音转文字,语音翻译。

    简介 chatgpt-java是一个OpenAI的Java版SDK,支持开箱即用.目前以支持官网全部Api.支持最新版本GPT-3.5-Turbo模型以及whisper-1模型.增加chat聊天对话以 ...

  10. MAC上反编译android apk---apktool, dex2jar, jd-jui安装使用(含手动签名)

    前文 介绍了在Windows平台利用强大的APK-Multi-Tool进行反编译apk,修改smali源码后再回编译成apk的流程,最近受人之托,破解个apk,所幸的是所用到的这三个软件都是跨平台的, ...

随机推荐

  1. 数组:ArrayList和int[]

    需要好好复习一下: 数组ArrayList和int[ ] int[ ] 多可以使用Arrays工具类导入后 使用Arrays.xxx(arr) 实现很多功能

  2. 详细剖析|袋鼠云数栈前端框架Antd 3.x 升级 4.x 的踩坑之路

    袋鼠云数栈从2016年发布第⼀个版本开始,就始终坚持着以技术为核⼼.安全为底线.提效为⽬标.中台为战略的思想,坚定不移地⾛国产化信创路线,不断推进产品功能迭代.技术创新.服务细化和性能升级. 在数栈过 ...

  3. Oracle 客户端深度指南:SQL Developer 与 PL/SQL Developer 全面安装使用教程

    作为拥有10年Oracle开发经验的资深工程师,我将为您提供一份专业级的客户端工具指南.无论您是初学者还是进阶开发者,本教程都将帮助您高效使用Oracle生态中最强大的两个工具. 一.工具对比与选择建 ...

  4. 4G CAT1 DTU RS232/485转4G Modbus RTU转4G Modbus TCP RS232/485转MQTT DLT-645/RTU转云平台JSON

    4G CAT1 DTU   RS232/485转4G   Modbus RTU转4G Modbus TCP   RS232/485转MQTT   DLT-645/RTU转云平台JSON 高性价比的CA ...

  5. 斐讯n1进入u盘启动

    前言 我将n1刷完电视系统后,看了几天电视,发现还行吧. 过了几天,突然想玩游戏,发现插入u盘重启,依然进入电视,并不进入u盘的游戏机系统. 提供以下脚本,局域网下其他远程设备执行即可. window ...

  6. CentOS7 - 安装NextCloud

    a { display: block } 首先安装LAMP环境 通过PhpMyAdmin,为NextCloud新建一个数据库.访问地址为 http://IP地址/phpmyadmin/ 下载最新版本的 ...

  7. 【HDU 1505】 City Game 单调栈

    传送门 HDU-1505 题意:找到矩阵中的最大子矩阵(有些点为障碍物). 思路: 看到网上清一色的dp,我就写一下这个题的单调栈做法.其实这个题和HDU-1506这个题是基本一样的. 1.在1506 ...

  8. C++ STL 源码 阅读

    简介 STL 最常用的源码 下载链接 https://github.com/steveLauwh/SGI-STL

  9. Markdown常用emoji表情

    .emoji { width: 45px } #emojilist { margin: 0 auto; text-align: center } #emojilist li { float: left ...

  10. 从零开始实现简易版Netty(四) MyNetty 高效的数据写出实现

    从零开始实现简易版Netty(四) MyNetty 高效的数据写出实现 1. MyNetty 数据写出处理优化 在上一篇博客中,lab3版本的MyNetty对事件循环中的IO读事件处理做了一定的优化, ...