[初识]使用百度AI接口,图灵机器人实现简单语音对话

一.准备

1.百度ai开放平台提供了优质的接口资源https://ai.baidu.com/ (基本免费)

2.在语音识别的接口中, 对中文来说, 讯飞的接口是很好的选择https://www.xfyun.cn/ (收费)

3.图灵机器人提供了可以用http访问的接口, http://www.turingapi.com/

二.创建

1.百度: 在具体功能中创建应用, 点击技术文档-> python sdk 按照文档使用

2.图灵机器人, 如果所示,创建机器人

在设置中可以对机器人的属性设置,包括年龄星座等, 之后可以点击查看api使用文档进行使用

三.使用

　　由于百度的语音识别需要的格式为.pcm, 而示例中主要用win系统自带的录音机文件进行声音采集,需要对文件转码.所以需要安装ffmpeg, 安装后将目录/bin配置进系统环境变量

　　配置完环境变量之后,编译器(pycharm)要重启一下,重新加载一下环境变量,否则会报错

　　如图,环境变量配置成功, cd命令切换到音频文件目录下, 使用下面的命令将文件转换为pcm格式

 ffmpeg -y  -i audio.wav  -acodec pcm_s16le -f s16le -ac  -ar  audio.pcm

# 1.你说一句话

# 2.根据语音转化为文字

# 3.机器人通过对文字的处理返回应答

# 4.将应答文字转化为语音,实现对话

import os

import requests

from aip import AipNlp, AipSpeech

""" 你的 APPID AK SK """

APP_ID = '输入 app_id'

API_KEY = '输入api_key'

SECRET_KEY = '输入secret_key'

client = AipNlp(APP_ID, API_KEY, SECRET_KEY)

client2 = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

client3 = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

# 1. 说-> 转换为文字

# 读取文件

def get_file_content(filePath):

    os.system(f'ffmpeg -y   -i {filePath}  -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm')

    with open(f'{filePath}.pcm', 'rb') as fp:

        return fp.read()

# 调用图灵机器人交互

def to_url(text, uid):

    url = 'http://openapi.tuling123.com/openapi/api/v2'

    data = {

        "reqType": 0,

        "perception": {

            "inputText": {

                "text": ""

            },

        },

        "userInfo": {

            "apiKey": "图灵机器人的apikey",

            "userId": ""

        }

    }

    data['userInfo']['userId'] = uid

    data['perception']['inputText']['text'] = text

    
    # 使用requests模块模拟http请求

    res = requests.post(url, json=data).json()

    return res.get('results')[-1].get('values').get('text')

# 将语音转化为文字

def text(file):

    # 识别本地文件

    ret = client2.asr(get_file_content(file), 'pcm', 16000, {

        'dev_pid': 1536,

    })

    text = ret.get('result')[-1]

    return text

# 将交互结果转化为语音

def to_audio(text):

    result = client3.synthesis(text, 'zh', 1, {

        'vol': 5,  # 音量

        'spd': 5,  # 语速

        'pit': 8,  # 音调

        'per': 4,  # 发声人选择

    })

    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码

    if not isinstance(result, dict):

        with open('auido.mp3', 'wb') as f:

            f.write(result)

    # 在win系统下 os.system可以直接打开这个文件

    os.system('auido.mp3')


# ####入口####

t = text('录音.m4a')  # 录音文件 放在这里


# NLP自然语言处理

ret = client.simnet('你爸爸是谁', t)

print(ret)

# {'log_id': 7122976772040456976, 'texts': {'text_2': '你把我是谁', 'text_1': '你爸爸是谁'}, 'score': 0.656308}

# 0.656308

score = ret.get('score')

print(score)

# 0.656308

if score >= 0.58: # score在0.58以上证明两个文本表达的意思基本一致

    to_audio('当然是罗伯特X了')

else:

    to_audio(t)

import os

from aip import AipSpeech,AipNlp

""" 你的 APPID AK SK """

APP_ID = ''

API_KEY = '5a8u0aLf2SxRGRMX3jbZ2VH0adfa'

SECRET_KEY = 'UAaqS13z6DjD9Qbjd065dAh0HjbqPrzVadfad'

client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)

client_nlp = AipNlp(APP_ID, API_KEY, SECRET_KEY)

# res = client_nlp.simnet("你叫什么名字","你的名字是什么")

# print(res)

def text2audio(text):

    result = client.synthesis(text, 'zh', 1, {

        "spd": 4,

        'vol': 5,

        "pit": 8,

        "per": 4

    })

    # 识别正确返回语音二进制 错误则返回dict 参照下面错误码

    if not isinstance(result, dict):

        with open('audio.mp3', 'wb') as f:

            f.write(result)

    return 'audio.mp3'

def audio2text(filepath):

    res = client.asr(get_file_content(filepath), 'pcm', 16000, {

        'dev_pid': 1536,

    })

    print(res.get("result")[0])

    return res.get("result")[0]

def get_file_content(filePath):

    os.system(f"ffmpeg -y  -i {filePath} -acodec pcm_s16le -f s16le -ac 1 -ar 16000 {filePath}.pcm")

    with open(f"{filePath}.pcm", 'rb') as fp:

        return fp.read()

def goto_tl(text,uid):

    URL = "http://openapi.tuling123.com/openapi/api/v2"

    import requests

    data = {

        "perception": {

            "inputText": {

                "text": "你叫什么名字"

            }

        },

        "userInfo": {

            "apiKey": "be41cf8596a24aec95b0e86be895cfa9asd",

            "userId": ""

        }

    }

    data["perception"]["inputText"]["text"] = text

    data["userInfo"]["userId"] = uid

    res = requests.post(URL, json=data)

    # print(res.content)

    # print(res.text)

    print(res.json())

    return res.json().get("results")[0].get("values").get("text")

text = audio2text("jttqhbc.m4a")

# 自然语言处理 简单实现

score = client_nlp.simnet("你叫什么名字",text).get("score")

print(score)

if score >= 0.58:

    filename = text2audio("需要回复的音频文件名")

    # os.system(f"ffplay {filename}")

    os.system(filename)

answer = goto_tl(text,"qiaoxiaoqiang")

filename = text2audio(answer)

os.system(filename)

库版

[初识]使用百度AI接口,图灵机器人实现简单语音对话的更多相关文章

Flask&&人工智能AI -- 6 人工智能初识，百度AI，图灵机器人
一.人工智能初识,百度AI的创建与应用参考连接:https://www.cnblogs.com/xiao987334176/p/9620113.html 1. 百度ai开放平台 2. AipSpee ...
人工智能-调百度AI接口+图灵机器人
1.登陆百度AI的官网 1.注册:没有账号注册 2.创建应用 3.创建应用 4.查看应用的ID 5.Python代码 from aip import AipSpeech APP_ID = " ...
百度ai和图灵123实现简单的语音对话
百度ai和图灵123实现简单的语音对话
基于flask和百度AI接口实现前后端的语音交互
话不多说,直接怼代码,有不懂的,可以留言简单的实现,前后端的语音交互. import os from uuid import uuid4 from aip import AipSpeech from ...
2019-02-15 python接口图灵机器人（简单好玩）
import requests import json def Run(text): url = "http://openapi.tuling123.com/openapi/api/v2&q ...
基于Flask和百度AI实现与机器人对话
实现对话机器人主要有个步骤 : 一.前端收集语音传入后端二.后端基于百度AI接口进行语音识别,转换成文字三.对文字进行自定义验证或通过图灵端口进行处理,生成回复内容四.将文字通过百度AI接口合成 ...
使用百度ai接口加图灵机器人完成简单web版语音对话
app文件 from flask import Flask, request, render_template, jsonify, send_file from uuid import uuid4 i ...
人工智能-基于百度baidu-ai和图灵机器人实现学说话机器人
本文引用了2个js文件,这里提供下CDN资源,! <script type="application/javascript" src="https://cdn.bo ...
百度ai 接口调用
1.百度智能云 2.右上角管理控制台 3.左上角产品服务选择应用 4.创建应用 5.应用详情下面的查看文档 6.选择pythonSDK 查看下面快速入门文档和接口说明文档. 7.按步骤写 ...

随机推荐

【转载】 IP实时传输协议RTP/RTCP详解
http://www.chinaitlab.com/cisco/RIP/832426.html 1.简介目前,在IP网络中实现实时语音.视频通信和应用已经成为网络应用的一个主流技术和发展方向,本文详 ...
【Redis】安装及简单使用
Redis介绍 Redis 是完全开源免费的,遵守BSD协议,是一个高性能的key-value数据库. Redis 与其他 key - value 缓存产品有以下三个特点: Redis支持数据的持久化 ...
linux_添加一个普通用户
useradd 用户名 passwd 密码 su 用户名可以切换用户 exit 返回之前登录的用户 sodu用户 --> 不用告诉普通用户root的密码可以查看所有的系统文件包括root下 ...
docker 加速器配置目录
centos 7 : /lib/systemd/system/docker.service
2019.01.20 bzoj3784: 树上的路径（二分答案+点分治）
传送门点分治好题. 题意简述:给一棵带边权的树,问所有路径中前mmm大的.m≤300000m\le300000m≤300000 思路: 网上有题解写了可以通过什么点分治序转化成超级钢琴那道题的做法蒟 ...
阿里ETL工具datax学习（一）
阿里云开源离线同步工具DataX3.0介绍一. DataX3.0概览 DataX 是一个异构数据源离线同步工具,致力于实现包括关系型数据库(MySQL.Oracle等).HDFS.Hive.Ma ...
快速创建一个 Servlet 项目（2）
1. 新建一个 webapp 参考 http://www.cnblogs.com/zno2/p/5909019.html 2.调整jdk版本修改 pom.xml 文件,将jdk 调整为适当的版本,比 ...
C++标准库addressof的应用
C++11将addressof作为标准库的一部分,用于取变量和函数等内存地址. 代码示例: #include <memory> #include <stdio.h> void ...
Linux批量远程命令和上传下载工具
https://github.com/eyjian/mooon/releases/tag/mooon-tools mooon_ssh:批量远程命令工具,在多台机器上执行指定命令 mooon_uploa ...
周鸿祎与85后的座谈（一）：人人需要Mentor，世界没有奇迹
我们公司现在有将近 4000 人,我觉得里面肯定是卧虎藏龙.百里挑一的话,也有 40 个伟大的人才.但是,即使是天才,如果没有前辈的帮助,最后也会变成庸才,是做不出什么大事的.举例来说,每一个跳水冠军 ...