https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672

简介:
Transcribe and translate audio offline on your personal computer. Powered by OpenAI’s Whisper.
转录和翻译音频离线在您的个人计算机。由OpenAI的Whisper提供动力。
可以简单理解为QT的前端界面,python语言构建服务端,使用Whisper语言模型进行计算语音转文字的软件。
痛点在于离线,缺点也很明显,模型较大,高质量模型运算依赖于硬件和算法优化

应用场景
学习,歌曲提取歌词,视频提取字幕,多媒体信息前置数据提取

软件下载
从github上进行下载,下载地址https://github.com/chidiwilliams/buzz

百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d

软件安装
windows软件安装的常规流程,双击exe,选择安装路径,进行安装

软件使用
首先双击Buzz.exe,然后打开音频文件

第一执行翻译任务会在用户安装目录下载模型,如果是下载时间过长,Windows版本下载路径为:C:\Users<username>\AppData\Local\Buzz\Buzz\Cache ,表示用户目录,大概率会失败报错,这里可以使用离线的模型包

模型离线下载
百度云盘离线下载 https://pan.baidu.com/s/1O8VxDW8Fx1yTB000u5WqJA?pwd=b67d
下载完成后有五个类别的模型,大小和名字一样,越大效果越强,当然也取决于硬件,运算量越大,耗时越长

复制解压出来的模型,复制和替换C:\Users<username>\AppData\Local\Buzz\Buzz\Cache 下的模型

开始进行任务翻译任务处理

准确率和效率
上面视频用的Tiny模型,这个模型很小,所以翻译效果一般,但是用时也很短
实测使用Large(体积最大)模型翻译最准确,但是对硬件的图形运算能力要求很高,花费时间也最长

日志和耗时信息
Tiny 模型耗时
whisper process completed with code = 0, time taken = 0:01:24.168368, number of segments = 155
Large 模型耗时
whisper process completed with code = 0, time taken = 0:20:40.773737, number of segments = 214
————————————————
版权声明:本文为CSDN博主「JerryLXu」的原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接及本声明。
原文链接:https://blog.csdn.net/oXiaoWeiWuDi/article/details/128925672

Buzz语音转文字安装使用(含Whisper模型下载)的更多相关文章

  1. C# 语音识别(文字to语音、语音to文字)

    最近打算研究一下语音识别,但是发现网上很少有C#的完整代码,就把自己的学习心得放上来,和大家分享一下. 下载API: 1)SpeechSDK51.exe                   (67.0 ...

  2. 机器人之路的第一小步:录音+语音识别(语音转文字),大小600K(免费下载)!

    机器人之路的第一小步:录音+语音识别(语音转文字),大小600K,本人出品! 机器人之路的第一小步:录音+语音识别,准确率还不是特别高,不过普通话标准的话,识别准确率还是不错的,大家可以体验一下,请下 ...

  3. iOS 10中如何搭建一个语音转文字框架

    在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...

  4. [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一) -- 安装jdk(含jre)及 MySql 5.6.39

    [原创] debian 9.3 搭建Jira+Confluence+Bitbucket项目管理工具(一)  --  安装jdk(含jre)及 MySql 5.6.39 回老家已经有一段时间了, 四五线 ...

  5. iOS语音播报文字

    记得大学的时候学微软Window Phone时,有语音识别类似苹果的嘿,Siri.今天无聊百度搜了一下,搜到苹果语音播报文字.自己试了下还挺好玩. 1.引入框架#import <AVFounda ...

  6. 语音识别系统:有免费实用的"语音到文字"的软件么?

    自从看了<李开复自传>,就对"语音识别系统"产生了非常深刻的印象. 根据自己的判断,语音识别系统还是非常有用的. 以自己的实际需求来看: 1.中国象棋中的应用. 中国象 ...

  7. Python使用websocket调用语音识别,语音转文字

    @ 目录 0. 太长不看系列,直接使用 1. Python调用标贝科技语音识别websocket接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1 ...

  8. 手把手使用Python语音识别,进行语音转文字

    0. 太长不看系列,直接使用 在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_s ...

  9. OpenAI Java SDK——chatgpt-java-v1.0.3更新支持GPT-3.5-Turbo,支持语音转文字,语音翻译。

    简介 chatgpt-java是一个OpenAI的Java版SDK,支持开箱即用.目前以支持官网全部Api.支持最新版本GPT-3.5-Turbo模型以及whisper-1模型.增加chat聊天对话以 ...

  10. MAC上反编译android apk---apktool, dex2jar, jd-jui安装使用(含手动签名)

    前文 介绍了在Windows平台利用强大的APK-Multi-Tool进行反编译apk,修改smali源码后再回编译成apk的流程,最近受人之托,破解个apk,所幸的是所用到的这三个软件都是跨平台的, ...

随机推荐

  1. 告别手动码字!AI智能生成+文档下载,职场/学习效率翻倍攻略!

    一.写在前面 本文重点介绍如何将AI智能生成文字直接转换为word文档,支持下载,最终提升大家学习和职场办公的效率. 二.实操环境 1.Pandoc-api服务: 下载地址:https://githu ...

  2. 详解鸿蒙Next仓颉开发语言中的全屏模式

    大家好,今天跟大家分享一下仓颉开发语言中的全屏模式. 和ArkTS一样,仓颉的新建项目默认是非全屏模式的,如果你的应用颜色比较丰富,就会发现屏幕上方和底部的留白,这是应用自动避让了屏幕上方摄像头区域和 ...

  3. Selenium框架

    Selenium框架 Selenium是一个自动化测试工具,用于模拟用户在Web应用程序上的操作.它提供了多种编程语言的接口,如Python.Java等,使测试人员能够编写自动化测试脚本.Seleni ...

  4. 渗透中的逆向工具-jsrpc实操手记

    前言 在渗透测试过程中,有些网站的接口参数是加密的.对于逆向小菜鸡的我来说,遇到这种网站总是束手无策,不能修改其中的参数,也就无法进行下一步的测试.偶然间发现一款js逆向工具jsrpc,它可以直接调用 ...

  5. python 安装的国内镜像源

    Python 镜像源是指可以用来下载 Python 相关软件包的在线仓库地址.Python 在国内使用的比较广泛,为了提高安装包的下载速度,一般会配置国内镜像源.常见的 Python 镜像源包括以下几 ...

  6. 设置div 内容不会换行 显示滚动条

    overflow-x: scroll; display: inline-block; white-space: nowrap; 内容不能脱离文档流否则还是会把div 撑开

  7. 这几个 Vibe Coding 经验,真的建议学!

    大家好,我是 Immerse,一名独立开发者.内容创作者.AGI 实践者. 关注公众号:#沉浸式趣谈,获取最新文章(更多内容只在公众号更新) 个人网站:https://yaolifeng.com 也同 ...

  8. CF576A Vasya and Petyas Game 题解

    CF576A Vasya and Petya's Game 数论思维题. 根据唯一分解定理,可以知道,如果一个数的各个质因数的数量确定了,这个数也就确定了. 每次询问的中,如果 \(x\) 是 \(y ...

  9. Python 潮流周刊#110:JIT 编译器两年回顾,AI 智能体工具大爆发(摘要)

    本周刊由 Python猫 出品,精心筛选国内外的 400+ 信息源,为你挑选最值得分享的文章.教程.开源项目.软件工具.播客和视频.热门话题等内容.愿景:帮助所有读者精进 Python 技术,并增长职 ...

  10. 前端开发系列088-Node篇之url

    本文对Node的内置模块url进行介绍,包括基本情况和简单使用. 一.模块的内容 url是Node的内置核心模块之一,无需单独安装可以直接在代码中通过var url = require("u ...