C#利用Vosk开源模型语音识别

#C#利用Vosk开源模型语音识别

#by wgscd

模型下载：VOSK Models (alphacephei.com) 找到chinese

Chinese
vosk-model-small-cn-0.22	42M	23.54 (SpeechIO-02) 38.29 (SpeechIO-06) 17.15 (THCHS)	Lightweight model for Android and RPi	Apache 2.0
vosk-model-cn-0.22	1.3G	13.98 (SpeechIO-02) 27.30 (SpeechIO-06) 7.43 (THCHS)

测试效果用麦克风+大模型（不是small模型包）还是挺不错，

如果识别系统电脑声音（系统音频卡输出语音，我们使用外部输入语音）就基本是无法准确识别！可惜！

using NAudio.Wave;

using System;

using System.Collections.Generic;

using System.Diagnostics;

using System.Linq;

using System.Text;

using System.Threading.Tasks;

using System.Windows;

using System.Windows.Controls;

using System.Windows.Data;

using System.Windows.Documents;

using System.Windows.Input;

using System.Windows.Media;

using System.Windows.Media.Imaging;

using System.Windows.Navigation;

using System.Windows.Shapes;

using Vosk;

namespace DYLive

{

    /// <summary>

    /// MainWindow.xaml 的交互逻辑

    /// </summary>

    public partial class Window1 : Window

    {

        public Window1()

        {

            InitializeComponent();

        }

        private Model model; //= new Model("modelcn");//程序根目录下  //   modelsmall-cn-0.22 小模型

        private WasapiLoopbackCapture waveIn;//WasapiLoopbackCapture 系统音频卡输出语音，我们使用外部输入语音

        //new WaveIn() 如果是录制麦克风用WaveIn

        private VoskRecognizer rec;

        private void InitRec()

        {

            waveIn = new WasapiLoopbackCapture(); //new WaveIn()、如果是录制麦克风用WaveIn

            waveIn.WaveFormat = new WaveFormat(16000, 16, 1);//44100 采样率16K就可以，太高会导致识别率下降，百度也使用16K

            waveIn.DataAvailable += WaveIn_DataAvailable;

            rec = new VoskRecognizer(model, waveIn.WaveFormat.SampleRate);//加载模型

            rec.SetMaxAlternatives(0);//设置备选项

            rec.SetWords(false);//设置是否显示时间

        }

        private void btnStart_Click(object sender, RoutedEventArgs e)

        {

            try

            {

                if (waveIn != null)

                {

                    waveIn.StartRecording();

                }

                else

                {

                    InitRec();

                }

            }

            catch

            {

            }

        }

        string result = "";

        private void WaveIn_DataAvailable(object sender, WaveInEventArgs e)

        {

            //int recLen = e.BytesRecorded;

            //byte[] data = new byte[recLen];

            //Array.Copy(e.Buffer, data, recLen);

            if (rec.AcceptWaveform(e.Buffer, e.BytesRecorded))

            {

                result = rec.Result()+ rec.PartialResult();

                if (result.Trim() != "")

                {

                    Debug.Print(result);

                    Dispatcher.Invoke(() => { txt.Text = result; });

                }

            }

            else

            {

                //Console.WriteLine(rec.FinalResult());//不要片段去分析，不然因为语义太少分析不出来

                //Console.WriteLine("---------");

              //  Debug.Print(rec.PartialResult());

                Dispatcher.Invoke(() => { Title = rec.PartialResult();  });

            }

        }

        private void btnStop_Click(object sender, RoutedEventArgs e)

        {

            try

            {

                if (waveIn != null)

                {

                    waveIn.StopRecording();

                }

            }

            catch

            {

            }

        }

        private void Window_Loaded(object sender, RoutedEventArgs e)

        {

            App.CloseSlashWindow();

            model= new Model("modelcn");//程序根目录下 new Model("modelsmall-cn-0.22");//程序根目录下

           // model =  new Model("modelsmall-cn-0.22");//程序根目录下

            InitRec();

        }

    }

}

C#利用Vosk开源模型语音识别的更多相关文章

利用谷歌开源工具cAdvisor 结合influxdb存储＋Grafana前端展示进行Docker容器的监控
一.Docker 监控方式 1.利用docker 的 docker stats API 命令: docker stats [容器ID/容器名称] [root@docker ~]# docker sta ...
R语言利用ROCR评测模型的预测能力
R语言利用ROCR评测模型的预测能力说明受试者工作特征曲线(ROC),这是一种常用的二元分类系统性能展示图形,在曲线上分别标注了不同切点的真正率与假正率.我们通常会基于ROC曲线计算处于曲线下方的 ...
Journal of Proteomics Research | 利用混合蛋白质组模型对MBR算法中错误转移鉴定率的评估
题目:Evaluating False Transfer Rates from the Match-between-Runs Algorithm with a Two-Proteome Model 期 ...
从开源模型、框架到自研，声网 Web 端虚拟背景算法正式发布
根据研究发现,在平均 38 分钟的视频会议里面,大概会有 13 分钟左右的时间用于处理和干扰相关的事情.同时研究也表明在参加在线会议的时候,人们更加倾向于语音会议,其中一个关键原因就是大家不希望个人隐 ...
python使用vosk进行中文语音识别
操作系统:Windows10 Python版本:3.9.2 vosk是一个离线开源语音识别工具,它可以识别16种语言,包括中文. 这里记录下使用vosk进行中文识别的过程,以便后续查阅. vosk地址 ...
NLP（十八）利用ALBERT提升模型预测速度的一次尝试
前沿在文章NLP(十七)利用tensorflow-serving部署kashgari模型中,笔者介绍了如何利用tensorflow-serving部署来部署深度模型模型,在那篇文章中,笔者利用k ...
小随笔：利用Shader实现模型爆炸和沙粒化的效果
0x00 前言上一篇小随笔<小随笔:利用Shader给斯坦福兔子长毛和实现雪地效果>中,我和大家聊了聊著名的斯坦福兔子和利用geometry shader实现的一些效果.这篇文章继续沿用 ...
利用Google开源Java容器化工具Jib构建镜像
转载:https://blog.csdn.net/u012562943/article/details/80995373 一.前言容器的出现让Java开发人员比以往任何时候都更接近“编写一次,到处运 ...
如何灵活利用免费开源图标字体-IcoMoon篇——张鑫旭
一.温故知新之前有专门介绍过如何使用类似fontforge软件制作自定义字符字体以及如何在web中实际应用. 不过,文中提到的是利用系统自带的一些特殊字体,如WINGDNG3.ttf字体. 显然,系 ...
生成EXCEL文件是经常需要用到的功能，我们利用一些开源库可以很容易实现这个功能。
方法一:利用excellibrary,http://code.google.com/p/excellibrary/ excellibrary是国人写的开源组件,很容易使用,可惜貌似还不支持.xlsx( ...

随机推荐

ArgoWorkflow教程(八)---基于 LifecycleHook 实现流水线通知提醒
本篇介绍一下 ArgoWorkflow 中的 ExitHandler 和 LifecycleHook 功能,可以根据流水线每一步的不同状态,执行不同操作,一般用于发送通知. 1. 概述本篇介绍一下 ...
在昇腾Ascend 910B上运行Qwen2.5推理
目前在国产 AI 芯片,例如昇腾 NPU 上运行大模型是一项广泛且迫切的需求,然而当前的生态还远未成熟.从底层芯片的算力性能.计算架构的算子优化,到上层推理框架对各种模型的支持及推理加速,仍有很多需要 ...
2-2 C++变量
目录 2.2.1 变量定义:列表初始化(list initialization) 2.2.2 变量的定义与声明 C++分离式编译定义与声明 2.2.3 C++变量命名 2.2.4 变量名的作用域(s ...
windows下git安装以及基本使用
Git的基本使用 Windows下Git的基本使用与操作安装Git 这个是一个git的windows系统的命令行版本 https://git-scm.com/downloads 安装 tortois ...
php 如何实现 git diff
无意间想到这个问题,如何用php来实现git diff,如果实现了这个功能,岂不是能够使用php对在线编辑文件的功能做更进一步的优化和提升? 查了一下还真有这样的库,话不多说,开始执行 compose ...
Elasticsearch之基本使用
这里大概解答下各个目录.配置文件的作用: 目录配置文件描述 bin 放置脚本文件,如启动脚本 elasticsearch, 插件安装脚本等. config elasticserch.yml e ...
MySQL 8.0 为什么会放弃查询缓存？
什么是查询缓存? 查询缓存就是将一次查询结果存储在内存中,假如下一次查询结果在内存中,就直接在内存中读取. 设计初衷当然是提高性能,通过缓存来减少解析器.优化器.存储引擎的执行时间. MySQL查询 ...
腾讯云 CHDFS 助力微信秒级异常检测
微信全景监控平台介绍微信全景监控平台,是微信的多维指标 OLAP 监控以及数据分析平台.支持自定义多维度指标上报,海量数据实时上卷下钻分析,提供了秒级异常检测告警能力. 项目高效支撑了视频号.微信支 ...
在 MySQL 创造类似 PipelineDB 的流视图(continuous view)
公司的系统采用的是 Google Cloud SQL 提供的 MySQL 数据库,由于历史原因,数据库成本极高,需要对它进行优化缩减成本. 相比 PostgresSQL,MySQL 主要缺少以下特性, ...
Rocky Linux8升级9随记
发现Rocky Linux已经升级了9.0版本,看着自己用着的8.5版本,跃跃欲试,于是就索性升级了.两者的支持年限没有太大的差别,先说我的想法:升不升级无所谓. 并不是9.0有什么特别牛的特性,只是 ...

C#利用Vosk开源模型语音识别

C#利用Vosk开源模型语音识别的更多相关文章

随机推荐

热门专题