Windows部署语音转文字项目_Whisper

Windows部署语音转文字项目_Whisper

一、前置安装准备

Github源仓库,Whisper

  1. 下载安装whisper及其依赖项

    官方有两种部署方法,一种是通过默认pip源拉取安装:

    以管理员身份运行powershell,输入如下命令

    pip install -U openai-whisper

    因国内网络环境问题,pip下载缓慢,可以通过国内镜像源加速下载,使用方法:

    pip install PACKAGE -i 国内源地址
    国内常用镜像源:
    清华源:https://pypi.tuna.tsinghua.edu.cn/simple (速度与完成度均优,推荐)
    阿里源:https://mirrors.aliyun.com/pypi/simple/
    网易源:https://mirrors.163.com/pypi/simple/
    豆瓣源:https://pypi.douban.com/simple/
    百度云源:https://mirror.baidu.com/pypi/simple/

    例如使用清华源加速下载:

    pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

    另一种方法通过从github仓库拉取源码安装:

    pip install git+https://github.com/openai/whisper.git

    等待下载安装完成。

    若安装成功,在powershell中输入whisper将得到以下输出:

  1. 安装chocolatey

    安装chocolatey是为了方便后续在Windows中安装ffmpeg

    继续在powershell中输入如下命令:

    Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

    在安装完成后,根据提示重启powershell,可输入choco检查是否成功安装:

  1. 安装ffmpeg

    在以管理员身份运行的powershell中输入命令进行安装ffmpeg:

    choco install ffmpeg

    安装完成后在powershell中输入ffmpeg将得到以下输出:

  1. NOTE

    在官方文档中提到若在上述安装过程中报错还须安装rust,安装命令如下:

    pip install setuptools-rust

    本文此前已完成安装

二、使用Whisper

可以通过命令行调用Whisper:

whisper AUDIO.mp3 --model MODEL_TYPE

即,whisper 路径+文件名 --model 调用模型名称

使用例子:

whisper D:/downloads/ted演讲.mp4 --model tiny

whisper有五种不同的模型,详细开销和运行速度如下图表所示:

首次使用模型需要下载,若出现报错Error 10054代码,则说明网络环境出现问题,进行全局代理再次运行命令下载模型即可。

此外,也可以指定语言识别输出:

whisper AUDIO.mp3 --model MODEL_TYPE --language Chinese

Windows部署语音转文字项目_Whisper的更多相关文章

  1. Windows Azure 入门 -- VS 2015部署 ASP.NET网站(项目) 与 数据库

    Windows Azure 入门 -- 部署 ASP.NET网站(项目) 与数据库 https://www.dotblogs.com.tw/mis2000lab/2015/12/24/windowsa ...

  2. Windows中使用TortoiseGit提交项目到GitLab配置

    下文来给各位介绍Windows中使用TortoiseGit提交项目到GitLab配置过程,下在全部图片希望对各位带来方便面. Gitlab默认的配置推荐使用shell命令行与server端进行交互,作 ...

  3. iOS 10中如何搭建一个语音转文字框架

    在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...

  4. 如何:使用 Visual Studio 中的一键式发布来部署 Web 应用程序项目

    原文: 如何:使用 Visual Studio 中的一键式发布来部署 Web 应用程序项目 本主题介绍如何在以下产品中使用 一键式发布 发布(部署)Web 应用程序项目: Visual Studio ...

  5. Visual Studio GitHub For Windows部署

    使用GitHub For Windows部署Visual Studio项目 因为最近同时再看很多技术方面的书,书上的例子有很多自己想亲自尝试一下,但是每次写例子都得创建一个新项目未免太麻烦,索性就整理 ...

  6. linux --- 部署前后端分离项目

    vue + uwsgi +nginx 部署前后端分离项目 准备项目 1.将前端vue项目包和后端django项目包上传服务器,通过lrzsz,直接从windows拖进linux中 2.解压缩操作 前端 ...

  7. eclipse配置tomcat,并部署一个Java web项目到tomcat上

    引用链接:https://blog.csdn.net/cincoutcin/article/details/79408484 eclipse配置tomcat 1.windows——preference ...

  8. 【转】Windows中使用TortoiseGit提交项目到GitLab配置

    转  原文地址 https://www.cnblogs.com/xiangwengao/p/4134492.html   下文来给各位介绍Windows中使用TortoiseGit提交项目到GitLa ...

  9. 如何使用域名访问自己的Windows服务器(Java web 项目)

    如何使用域名访问自己的Windows服务器(Java web 项目) 写在前面 前段时间在阿里云弄了个学生服务器,就想着自己搭建一个网站试一试,在网上查阅相关资料时发现大部分都是基于服务器是Linux ...

  10. 流媒体 Ubuntu部署srs、windows部署nginx

    一.获取项目//码云克隆git clone https://gitee.com/winlinvip/srs.oschina.git srs//githubgit clone https://githu ...

随机推荐

  1. 应急响应web1

    应急响应的过程 目的:分析攻击时间.攻击操作.攻击结果.安全修复等并给出合理的解决方案. 保护阶段:直接断网,保护现场,看是否能够恢复数据: 分析阶段:对入侵过程进行分析,常见的方法为指纹库搜索.日志 ...

  2. SQLServer统计监控SQL执行计划突变的方法

    使用动态管理视图(DMVs)来检测SQL执行计划的突变,你需要关注那些能够提供查询执行统计和计划信息的视图.以下是一些可以用于此目的的DMVs以及相应的查询示例: sys.dm_exec_query_ ...

  3. Vue cli传递数据

    Nav组件和Forecast组件都是Home组件的子组件. (1)子组件传递数据给父组件 在子组件中,通过this.$emit('自定义事件名', 参数1,参数2,...)来调用父组件中定义的事件. ...

  4. 微软的文本转语音服务Microsoft.CognitiveServices.Speech

    微软的Edge 浏览器里的大声朗读里-"晓晓" 很接近自然人,比起其它平台的强很多. 在AZURE 可免费体验,每月限额50万字,每个语音转换不超过10分钟长度. C# 调用: u ...

  5. Yarp 让系统内调度更灵活 http、https、websocket 反向代理

    简介 Yarp 是微软团队开发的一个反向代理组件, 除了常规的 http 和 https 转换通讯,它最大的特点是可定制化,很容易根据特定场景开发出需要的定制代理通道. 详细介绍:https://de ...

  6. FRDM-MCXN947开发板之RGB灯

    一.背景 RGB LED:通过红.绿.蓝三种颜色组合发光的LED,可以理解由三个不同发光属性的LED组成,这个是LCD平板显示原理的基础,一个LED相当于屏幕上面的一个像素 FRDM-MCXN947集 ...

  7. python+k8s——基础练习

    列表 core_api = client.CoreV1Api() # 管理核心资源(Pod, Service, ConfigMap 等) apps_api = client.AppsV1Api() # ...

  8. yum install 出错

    ``` yum -y install ansible ``` 出错 一直在刷屏,刚开始以为在安装但是最后没有安装成功 百度发现是这是redhat7和8的yum源混用 1.先确认本机器系统信息 cat ...

  9. 键盘中断,键盘驱动,基于Linux0.11

    键盘,咱们做计算机这一行的自然不必多说,天天与它打交道.但熟归熟,清楚键盘背后的原理吗?键盘上都标有各键的名称,表明了各键所代表的意义,但是计算机是如何知道的?组合键是怎样实现的?按下一个代表字符的键 ...

  10. 思迅Pay PC ,WIN7 ,KB3042058

    思迅Pay PC ,WIN7, COM , 串口 . 577,驱动. WIN7 SHA256补丁,KB3033929,https://www.microsoft.com/zh-CN/download/ ...