dome 模块 pyaudio 声音处理

为语音识别准备

直接上例子

dome1 声音强度检查

import pyaudio

import numpy as np

class QAudio:

    CHUNK = 512

    FORMAT = pyaudio.paInt16

    CHANNELS = 1

    RATE = 48000

    def __init__(self):

        self.paudio = None

        self.stream = None

    def open(self):

        self.paudio = pyaudio.PyAudio()

        self.stream = self.paudio.open(format=self.FORMAT,

                                       channels=self.CHANNELS,

                                       rate=self.RATE,

                                       input=True,

                                       frames_per_buffer=self.CHUNK)

    def read(self):

        data = self.stream.read(self.CHUNK)

        return data

    def close(self):

        self.stream.close()

        self.paudio.terminate()

def main():

    a = QAudio()

    a.open()

    print("开始聆听...")

    while True:

        data = a.read()

        audio_data = np.fromstring(data, dtype=np.short)

        temp = np.max(audio_data)

        print(f'当前声音强度值： {"*"*(temp//100)}')

if __name__ == '__main__':

    main()

dome2 录音_播放_写到文件

import pyaudio

import wave

class QAudio:

    CHUNK = 512

    FORMAT = pyaudio.paInt16

    CHANNELS = 1

    RATE = 48000

    def __init__(self):

        self.paudio = None

        self.stream = None

    def open(self):

        self.paudio = pyaudio.PyAudio()

        self.stream = self.paudio.open(format=self.FORMAT,

                                       channels=self.CHANNELS,

                                       rate=self.RATE,

                                       input=True,

                                       frames_per_buffer=self.CHUNK)

    def read(self):

        data = self.stream.read(self.CHUNK)

        return data

    def read_s(self, time=1):

        data = []

        for _ in range(self.RATE//self.CHUNK*time):

            data.append(self.stream.read(self.CHUNK))

        return data

    def close(self):

        self.stream.close()

        self.paudio.terminate()

    def save(self, filename='tmp.wav', data=[]):

        wf = wave.open(filename, "wb")

        wf.setnchannels(self.CHANNELS)

        wf.setsampwidth(2)

        wf.setframerate(self.RATE)

        wf.writeframes(b"".join(data))

        wf.close()

    def play(self, path="tmp.wav"):

        # 定义数据流块

        chunk = 1024

        # 只读方式打开wav文件

        f = wave.open(path, "rb")

        # 打开数据流

        fstream = self.paudio.open(format=self.paudio.get_format_from_width(f.getsampwidth()),

                                   channels=f.getnchannels(),

                                   rate=f.getframerate(),

                                   output=True)

        # 读取数据

        data = f.readframes(chunk)

        # 播放

        while data:

            fstream.write(data)

            data = f.readframes(chunk)

        # 停止数据流

        fstream.stop_stream()

        fstream.close()

def main():

    a = QAudio()

    a.open()

    print('开始录音')

    data = a.read_s(10)

    print('保存录音')

    a.save(data=data)

    print('播放声音')

    a.play()

    a.close()

if __name__ == '__main__':

    main()

dome3 自动断句录音,你说啥我说啥

为语音识别准备

import pyaudio

import wave

import numpy as np

class QAudio:

    CHUNK = 512

    FORMAT = pyaudio.paInt16

    CHANNELS = 1

    RATE = 48000

    def __init__(self):

        self.paudio = None

        self.stream = None

    def open(self):

        self.paudio = pyaudio.PyAudio()

        self.stream = self.paudio.open(format=self.FORMAT,

                                       channels=self.CHANNELS,

                                       rate=self.RATE,

                                       input=True,

                                       frames_per_buffer=self.CHUNK)

    def read(self):

        data = self.stream.read(self.CHUNK)

        return data

    def read_s(self, time=1.0):

        data = []

        for _ in range(int(self.RATE//self.CHUNK*time)):

            data.append(self.stream.read(self.CHUNK))

        return data

    def close(self):

        self.stream.close()

        self.paudio.terminate()

    def save(self, filename='tmp.wav', data=[]):

        wf = wave.open(filename, "wb")

        wf.setnchannels(self.CHANNELS)

        wf.setsampwidth(2)

        wf.setframerate(self.RATE)

        wf.writeframes(b"".join(data))

        wf.close()

    def play(self, path="tmp.wav"):

        # 定义数据流块

        chunk = 1024

        # 只读方式打开wav文件

        f = wave.open(path, "rb")

        # 打开数据流

        fstream = self.paudio.open(format=self.paudio.get_format_from_width(f.getsampwidth()),

                                   channels=f.getnchannels(),

                                   rate=f.getframerate(),

                                   output=True)

        # 读取数据

        data = f.readframes(chunk)

        # 播放

        while data:

            fstream.write(data)

            data = f.readframes(chunk)

        # 停止数据流

        fstream.stop_stream()

        fstream.close()

    def read_auto(self):

        self.read_s(0.1)  # 先取0.1s,清一下buf

        while True:

            data = []

            flag = None

            count = 1

            while True:

                result = self.read()

                audio_data = np.fromstring(result, dtype=np.short)

                # audio_data = np.array(result)

                temp = np.max(audio_data)

                print(f'当前声音强度值： {"*" * (temp // 100)}')

                if temp < 400:

                    if flag:

                        count -= 1

                        if count < 0:

                            break

                    continue

                else:

                    flag = True

                    data.append(result)

            print(len(data))

            if len(data) > (self.RATE//self.CHUNK)//3:

                break

        return data

def main():

    a = QAudio()

    a.open()

    while True:

        print('开始录音')

        data = a.read_auto()

        print('保存录音')

        a.save(data=data)

        print('播放声音')

        a.play()

        # 清空buff 避免噪音回响

        a.read_s(len(data)//(a.RATE//a.CHUNK)+0.5)

if __name__ == '__main__':

    main()

dome 模块 pyaudio 声音处理为语音识别准备的更多相关文章

Unity 声音处理之语音识别
音量检测检测当前麦克风的输入音量 using System.Collections; using System.Collections.Generic; using UnityEngine; usi ...
基于语音识别、音文同步、图像OCR的字幕解决方案HtwMedia介绍
背景介绍俗话说,“好记性不如乱笔头”,这充分说明了文字归档的重要性.如今随着微信.抖音等移动端app的使用越来越广,人们生产音.视频内容也越来越便捷.而相比语音和视频而言,文字具有易存档.易检索.易 ...
关于编码和解码问题——encode、decode
一.背景和问题近期在做一个关于声卡录音的项目,开发环境是win10 64位家庭中文版,pycharm2019.1,python3.6(Anaconda3),python模块pyaud ...
webrtc中APM（AudioProcessing module）的使用
一,实例化和配置 AudioProcessing* apm = AudioProcessing::Create(0); //这里的0指的是channelID,只是一个标注那个通道的表示 apm-> ...
AngularJs angular.injector、angular.module
angular.injector 创建一个injector对象, 调用injector对象的方法可用于获取服务以及依赖注入. 格式:angular.injector(modules); modules ...
webrtc--AudioProcessing的使用
1.AudioProcessing的实例化和配置: AudioProcessing* apm = AudioProcessing::Create(0); apm->level_estimator ...
LINUX下 Udev详解
如果你使用Linux比较长时间了,那你就知道,在对待设备文件这块,Linux改变了几次策略.在Linux早期,设备文件仅仅是是一些带有适当的属性集的普通文件,它由mknod命令创建,文件存放在/dev ...
【Cocos2d-X开发笔记】第一期 Cocos2d-X的环境搭建
作者今天开始正式开始学习Cocos2d-X引擎进行游戏编程,预计两天会更新一期,最后实现ios游戏的appsore上线. (部分内容转载自:http://blog.csdn.net/yan ...
【Cocos2d-X开发学习笔记】第01期：PC开发环境的详细搭建
本文使用的是cocos2d-x-2.1.4版本 ,截至目前为止是最新稳定版所谓的开发环境就是制作游戏的地方,打个比方读者就会十分清楚了.比如提到做饭,人们都会想到厨房.这是因为厨房有炉灶.烟机.水 ...

随机推荐

关于响应式web设计
手机网站+电脑网站+平版网站 = 响应式网站在没有足够经费跟精力的做一个手机网站的情况下,响应式网站是个不错的选择.它有以下的优点: 减少工作量(网站代码只要一份,只需要做js方面的改动及可以了) ...
教你如何使用css隐藏input的光标
今天公司的ui突然跑过来问我一个问题:"如何在不影响操作的情况下,把input的光标隐藏了?". 我相信很多人会跟我一样,觉得这是个什么狗屁需求,输入框不要光标这不是反人类吗?可惜 ...
大厂常问iOS面试题--多线程篇
1.进程与线程进程: 1.进程是一个具有一定独立功能的程序关于某次数据集合的一次运行活动,它是操作系统分配资源的基本单元. 2.进程是指在系统中正在运行的一个应用程序,就是一段程序的执行过程,我们可 ...
牛客网剑指offer第34题——找到第一个只出现一次的字符
题目如下: 在一个字符串(0<=字符串长度<=10000,全部由字母组成)中找到第一个只出现一次的字符,并返回它的位置, 如果没有则返回 -1(需要区分大小写). 先上代码: class ...
Fortify Audit Workbench 笔记 Access Control: Database
Abstract 如果没有适当的 access control,就会执行一个包含用户控制主键的 SQL 指令,从而允许攻击者访问未经授权的记录. Explanation Database access ...
Vue2.0 【第一季】第3节 v-for指令：解决模板循环问题
目录 Vue2.0 [第一季] 第3节 v-for指令:解决模板循环问题第三节 v-for 指令一.基本用法: 二.排序三.对象循环输出 Vue2.0 [第一季] 第3节 v-for指令:解决模 ...
Mac OS X 10.13上安装odoo 11.0开发环境
0.准备假设homebrew已经安装好没安装的需要先安装,见下面链接http://brew.sh/ 1.安装PostgreSQL$ brew tap homebrew/services$ brew i ...
Pocket+Evernote 打造个人知识库体系
俗话说巧妇难为无米之炊,还是那个不太恰当的例子. 写作就好比人类的消化系统,想要持续的输出...那么就要持续的输入... 今天就来说一说如何进行持续有效的输入. 信息处理过程先放一张图,这是我的整个 ...
浅析Redis分布式锁---从自己实现到Redisson的实现
当我们在单机情况下,遇到并发问题,可以使用juc包下的lock锁,或者synchronized关键字来加锁.但是这俩都是JVM级别的锁,如果跨了JVM这两个锁就不能控制并发问题了,也就是说在分布式集群 ...
微服务系列之 Consul 注册中心
原文链接:https://mrhelloworld.com/posts/spring/spring-cloud/consul-service-registry/ Netflix Eureka 2.X ...

dome 模块 pyaudio 声音处理 为语音识别准备

dome 模块 pyaudio 声音处理

dome1 声音强度检查

dome2 录音_播放_写到文件

dome3 自动断句录音,你说啥我说啥

dome 模块 pyaudio 声音处理 为语音识别准备的更多相关文章

随机推荐

热门专题

dome 模块 pyaudio 声音处理为语音识别准备

dome 模块 pyaudio 声音处理为语音识别准备的更多相关文章