人工智能-baidu-aip语音识别(语音转文字)

做这个之前,需要在电脑上安装FFmpeg工具,将要转的语音格式转为PCM格式.
FFmpeg不需要安装,下载后,打开bin文件夹，然后将路径放在系统环境变量里.
记住,要关闭所有打开的Pycharm,然后重启,FFmpeg的环境变量才生效.

1.打开bin文件

2.复制文件所在路径

D:\ffmpe-win64-shared\ffmpeg-20180619-a990184-win64-shared\bin

3.添加系统环境变量

下面是代码部分：

# Python

import os

# Third-party Library

from aip import AipSpeech

APP_ID = ''

APP_KEY = 'DhXGtWHYMujMVZZGRI3a7rzb'

SECRET_KEY = 'PbyUvTL31fImGthOOIP5ZbbtEOGwGOoT'

# 与百度进行一次加密校验,认证你是合法用户合法的应用

# AipSpeech是百度语音的客户端,认证成功之后,客户端将被开启,这里的client就是已经开启的百度语音的客户端了

client = AipSpeech(APP_ID, APP_KEY, SECRET_KEY)

# 1.将wma格式文件转为pcm格式文件

def get_file_content(filePath):

    # 执行cmd命令os.system()

    os.system(f"ffmpeg -y  -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")

    with open(f"{filePath}.pcm", 'rb') as fp:

        return fp.read()

# 2.将音频转成文字

res = client.asr(get_file_content('media/weather.wma'), 'pcm', 16000, {

    # 不填写lan参数生效,都不填写,默认1537(普通话 输入法模型),dev_pid参数见本节开头的表格

    'dev_pid': 1536,

})

# 将录音转成文字,然后打印

print(res.get("result")[0])

人工智能-baidu-aip语音识别(语音转文字)的更多相关文章

机器人之路的第一小步：录音+语音识别(语音转文字)，大小600K(免费下载)！
机器人之路的第一小步:录音+语音识别(语音转文字),大小600K,本人出品! 机器人之路的第一小步:录音+语音识别,准确率还不是特别高,不过普通话标准的话,识别准确率还是不错的,大家可以体验一下,请下 ...
阿里语音识别(语音转文字)java调用全程手把手详解-适合中小学生快速上手
阿里语音识别服务java调用全程手把手详解-适合中小学生快速上手阿里语音识别与百度语音识别的调用对比: 用例:1分30秒的录音文件百度用时:3秒阿里用时:30秒识别准确率来看 ...
C# 语音识别（文字to语音、语音to文字）
最近打算研究一下语音识别,但是发现网上很少有C#的完整代码,就把自己的学习心得放上来,和大家分享一下. 下载API: 1)SpeechSDK51.exe (67.0 ...
语音识别系统：有免费实用的"语音到文字"的软件么？
自从看了<李开复自传>,就对"语音识别系统"产生了非常深刻的印象. 根据自己的判断,语音识别系统还是非常有用的. 以自己的实际需求来看: 1.中国象棋中的应用. 中国象 ...
Python使用websocket调用语音识别，语音转文字
@ 目录 0. 太长不看系列,直接使用 1. Python调用标贝科技语音识别websocket接口,实现语音转文字 1.1 环境准备: 1.2 获取权限 1.2.1 登录 1.2.2 创建新应用 1 ...
手把手使用Python语音识别，进行语音转文字
0. 太长不看系列,直接使用在1.2官网注册后拿到APISecret和APIKey,直接复制文章2.4demo代码,确定音频为wav格式,采样率为16K,在命令行执行 python single_s ...
与众不同 windows phone (45) - 8.0 语音: TTS, 语音识别, 语音命令
[源码下载] 与众不同 windows phone (45) - 8.0 语音: TTS, 语音识别, 语音命令作者:webabcd 介绍与众不同 windows phone 8.0 之语音 TT ...
iOS 10中如何搭建一个语音转文字框架
在2016WWDC大会上,Apple公司介绍了一个很好的语音识别的API,那就是Speech framework.事实上,这个Speech Kit就是Siri用来做语音识别的框架.如今已经有一些可用的 ...
java语音转文字
用到的百度提供的api 需要把wav音频文件转成16k的频率,必须转,不转百度api解析不出来.显示音频文件不清晰错误.想要转化还必须要有ffmpeg程序,这个自己百度去下载.然后拿转好的文件扔到百度 ...

随机推荐

JPA JPQL 查询、排序.....(转)
http://macrabbit.iteye.com/blog/855384 JPQL就是一种查询语言,具有与 SQL 相类似的特征, JPQL 是完全面向对象的,具备继承.多态和关联等特性,和hib ...
http://www.allegro-skill.com/thread-2506-1-1.html
http://www.allegro-skill.com/thread-2506-1-1.html
项目实践中--Git服务器的搭建与使用指南
一.前言 Git是一款免费.开源的分布式版本控制系统,用以有效.高速的处理从很小到非常大的项目版本管理.在平时的项目开发中,我们会使用到Git来进行版本控制. Git的功能特性: 从一般开发者的角度来 ...
cookie转coontoin
/// <summary> /// 一个到多个Cookie的字符串添加到CookieCollection集合中[isGood代码] /// </summary> /// < ...
Spring的AOP配置
Spring的AOP配置 1.先写一个普通类: package com.spring.aop; public class Common { public void execute(String us ...
PILE读书笔记_进程环境
进程是操作系统运行程序的一个实例, 也是操作系统分配资源的单位. 在Linux环境中, 每个进程都有独立的进程空间, 以便对不同的进程进行隔离, 使之不会互相影响. atexit函数 #include ...
java-ApiValueDemo
关于API相关正则表达式,各方法的使用 package com.example; import java.util.Arrays; import java.util.Scanner; /** * Ap ...
jquery省份城市选择器
var pro = ["北京","天津","上海","重庆","河北","山西" ...
MFC使用自带的MSXML6.dll解析xml(开发环境vc2010)
程序是win32控制台程序 // msxml.cpp : 定义控制台应用程序的入口点. #include "stdafx.h" #include <iostream> ...
开发GPIO驱动的基本套路
最近完成了基于AR9331的GPIO驱动的开发,主要包括:控制一个连接GPIO的灯控:接收一个连接GPIO的按键事件:以及接收一个连接GPIO的脉冲事件. 这里,结合开发实践,总结一下GPIO驱动开发 ...

人工智能-baidu-aip语音识别(语音转文字)

人工智能-baidu-aip语音识别(语音转文字)的更多相关文章

随机推荐

热门专题