Windows部署语音转文字项目_Whisper

Windows部署语音转文字项目_Whisper

一、前置安装准备

Github源仓库,Whisper

  1. 下载安装whisper及其依赖项

    官方有两种部署方法,一种是通过默认pip源拉取安装:

    以管理员身份运行powershell,输入如下命令

    pip install -U openai-whisper

    因国内网络环境问题,pip下载缓慢,可以通过国内镜像源加速下载,使用方法:

    pip install PACKAGE -i 国内源地址
    国内常用镜像源:
    清华源:https://pypi.tuna.tsinghua.edu.cn/simple (速度与完成度均优,推荐)
    阿里源:https://mirrors.aliyun.com/pypi/simple/
    网易源:https://mirrors.163.com/pypi/simple/
    豆瓣源:https://pypi.douban.com/simple/
    百度云源:https://mirror.baidu.com/pypi/simple/

    例如使用清华源加速下载:

    pip install -U openai-whisper -i https://pypi.tuna.tsinghua.edu.cn/simple

    另一种方法通过从github仓库拉取源码安装:

    pip install git+https://github.com/openai/whisper.git

    等待下载安装完成。

    若安装成功,在powershell中输入whisper将得到以下输出:

  1. 安装chocolatey

    安装chocolatey是为了方便后续在Windows中安装ffmpeg

    继续在powershell中输入如下命令:

    Set-ExecutionPolicy Bypass -Scope Process -Force; [System.Net.ServicePointManager]::SecurityProtocol = [System.Net.ServicePointManager]::SecurityProtocol -bor 3072; iex ((New-Object System.Net.WebClient).DownloadString('https://community.chocolatey.org/install.ps1'))

    在安装完成后,根据提示重启powershell,可输入choco检查是否成功安装:

  1. 安装ffmpeg

    在以管理员身份运行的powershell中输入命令进行安装ffmpeg:

    choco install ffmpeg

    安装完成后在powershell中输入ffmpeg将得到以下输出:

  1. NOTE

    在官方文档中提到若在上述安装过程中报错还须安装rust,安装命令如下:

    pip install setuptools-rust

    本文此前已完成安装

二、使用Whisper

可以通过命令行调用Whisper:

whisper AUDIO.mp3 --model MODEL_TYPE

即,whisper 路径+文件名 --model 调用模型名称

使用例子:

whisper D:/downloads/ted演讲.mp4 --model tiny

whisper有五种不同的模型,详细开销和运行速度如下图表所示:

首次使用模型需要下载,若出现报错Error 10054代码,则说明网络环境出现问题,进行全局代理再次运行命令下载模型即可。

此外,也可以指定语言识别输出:

whisper AUDIO.mp3 --model MODEL_TYPE --language Chinese

Windows部署语音转文字项目_Whisper的更多相关文章

  1. Windows Azure 入门 -- VS 2015部署 ASP.NET网站(项目) 与 数据库

    Windows Azure 入门 -- 部署 ASP.NET网站(项目) 与数据库 https://www.dotblogs.com.tw/mis2000lab/2015/12/24/windowsa ...

  2. Windows中使用TortoiseGit提交项目到GitLab配置

    下文来给各位介绍Windows中使用TortoiseGit提交项目到GitLab配置过程,下在全部图片希望对各位带来方便面. Gitlab默认的配置推荐使用shell命令行与server端进行交互,作 ...

  3. iOS 10中如何搭建一个语音转文字框架

    在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...

  4. 如何:使用 Visual Studio 中的一键式发布来部署 Web 应用程序项目

    原文: 如何:使用 Visual Studio 中的一键式发布来部署 Web 应用程序项目 本主题介绍如何在以下产品中使用 一键式发布 发布(部署)Web 应用程序项目: Visual Studio ...

  5. Visual Studio GitHub For Windows部署

    使用GitHub For Windows部署Visual Studio项目 因为最近同时再看很多技术方面的书,书上的例子有很多自己想亲自尝试一下,但是每次写例子都得创建一个新项目未免太麻烦,索性就整理 ...

  6. linux --- 部署前后端分离项目

    vue + uwsgi +nginx 部署前后端分离项目 准备项目 1.将前端vue项目包和后端django项目包上传服务器,通过lrzsz,直接从windows拖进linux中 2.解压缩操作 前端 ...

  7. eclipse配置tomcat,并部署一个Java web项目到tomcat上

    引用链接:https://blog.csdn.net/cincoutcin/article/details/79408484 eclipse配置tomcat 1.windows——preference ...

  8. 【转】Windows中使用TortoiseGit提交项目到GitLab配置

    转  原文地址 https://www.cnblogs.com/xiangwengao/p/4134492.html   下文来给各位介绍Windows中使用TortoiseGit提交项目到GitLa ...

  9. 如何使用域名访问自己的Windows服务器(Java web 项目)

    如何使用域名访问自己的Windows服务器(Java web 项目) 写在前面 前段时间在阿里云弄了个学生服务器,就想着自己搭建一个网站试一试,在网上查阅相关资料时发现大部分都是基于服务器是Linux ...

  10. 流媒体 Ubuntu部署srs、windows部署nginx

    一.获取项目//码云克隆git clone https://gitee.com/winlinvip/srs.oschina.git srs//githubgit clone https://githu ...

随机推荐

  1. 文件上传--php user.ini详解

    文件上传 参考文档:https://www.php.net/manual/zh/configuration.file.per-user.php 如果你的 PHP 以模块化运行在 Apache 里,则用 ...

  2. 记录Notion API Authorization中的一个坑

    正文 Notion官方文档的Authorization部分提到: In your integration code, include the token in the Authorization he ...

  3. $KMP$学习记

    <不浪漫罪名>--王杰 没有花 这刹那被破坏吗 无野火都会温暖吗 无烟花一起庆祝好吗 若爱恋 仿似戏剧那样假 如布景一切都美化 连相拥都参照主角吗 你说我未能定时 令你每天欢笑一次 我没说 ...

  4. C语言:算法题判断是否有效字符({[]})---括号

    给定一个只包括 '(',')','{','}','[',']'的字符串 s ,判断字符串是否有效. 有效字符串需满足:                  左括号必须用相同类型的右括号闭合.       ...

  5. IPv6 — 综合组网技术

    目录 文章目录 目录 前文列表 IPv4v6 综合组网技术(转换机制) 双栈策略 隧道策略 前文列表 <IPv6 - 网际协议第 6 版> <IPv6 - 地址格式与寻址模式> ...

  6. docker之docker-compose

    docker-compose就是个二进制的工具,它可以单机编排,批量管理多个容器 [root@mcwk8s01 harbor]# file /usr/local/bin/docker-compose ...

  7. C#应用的用户配置窗体方案 - 开源研究系列文章

    这次继续整理以前的代码.本着软件模块化的原理,这次笔者对软件中的用户配置窗体进行剥离出来,单独的放在一个Dll类库里进行操作,这样在其它应用程序里也能够快速的复用该类库,达到了快速开发软件的效果. 笔 ...

  8. openssl 生成多域名 多IP 的数字证书

    openssl.cnf 文件内容: [req] default_bits = 2048 distinguished_name = req_distinguished_name copy_extensi ...

  9. Linux之top命令分析

    第一行: top - 04:25:26 当前系统时间 up 3 min, 系统已经运行的时间(不间歇的运行) 1 user, 当前登录系统的用户数 load average: 0.01, 0.03, ...

  10. Android 12(S) MultiMedia Learning(三)MediaPlayer Native

    上一篇MediaPlayer中看到实现一个最简单的播放器只需要5个接口,接下来会看看这些接口实现内容 /************************************************ ...