搭建一个属于自己的语音对话机器人

搭建一个属于自己的语音对话机器人

“零基础– 搭建一个属于自己的机器人

 

首先请想象一下,当你回到家,只有一个人在家,但却没有人聊天,然后你发出了一个命令,电脑便开始自动与你对话,而你不需要打字,不需要看屏幕,因为她会自己发出声音,回应你的问题,以及问候。

01—编程思路很重要

有一个好的想法,并把它用代码实现出来,怎么实现,这就比较重要了。

首先,想一下,假如没有看这篇文章,你们会怎么去实现自动回复的机器人,然后再来看我的解决方式,因为我这个也不是最优的解决方式。

 

思路:

1、首先想到的是宏观的,我想要说话,然后让机器立马做出响应,并通过喇叭回答我们,这是我们的需求。

2、我们把他拆分,变成一些小的需求。

(1)我要说话,会产生声音,系统不能翻译声音,那我们要记录下我们发出的声音。

(2)将声音转化为文字。

(3)将文字发送给自己训练的机器人,但自己训练机器人比较难,这时候使用第三方接口,自动回复,就像公众后台的小灵机器人一样。

3、那我们具体的流程就出来了。

声音—->音频文件—–>调用第三方接口(语音识别)——->文字——->发送给图灵机器人——->机器人做出回复——->返回文字——->文字转语音—->输出并发出声音。

突然感觉一阵头晕搭建一个属于自己的语音对话机器人,怎么调来调去的。

 

02—语音生成音频文件

语音生成文件,我们需要录音,并保存到文件中,那python要怎么实现启动录音并保存文件呢?

好好想一想!

这里需要导入一个模块,正所谓,那里不会导哪里!嘿嘿,python就是这么强。

导入模块,这里需要安装一个pip install pyaudio

import wave
from pyaudio import PyAudio,paInt16

有兴趣的可以去了解一下,继续来看实现代码

def save_wave_file(filename,data):#保存音频文件
    wf=wave.open(filename,'wb')
    wf.setnchannels(1)
    wf.setsampwidth(2)
    wf.setframerate(8000)
    wf.writeframes(b"".join(data))
    wf.close()

def my_record():#实现录音
    pa=PyAudio()
    stream=pa.open(format = paInt16,channels=1,
                   rate=8000,input=True,
                   frames_per_buffer=2000)
    my_buf=[]
    count=0
    print("正在录音")
    while count<2*15:#控制录音时间,15秒
        audio= stream.read(2000)
        my_buf.append(audio)
        count+=1
        # print('.')
    save_wave_file('01.wav',my_buf)#调用保存音频文件函数
    stream.close()
    print("录音完成!")

语音生成音频文件搞定

 

03—音频文件转文字

 

我们已经在上面获取到了音频文件,那要怎么把音频文件转化为文字呢?

我们继续:

这里可以使用第三方的语音识别接口,这里我使用的事百度的接口,因为比较简单,相关的api大家可以自己去研究一下。

导入模块:pip install baidu_aip

from aip import AipSpeech

导入我们需要的模块名,然后将音频文件发送给出去,返回文字。

这里的三个参数就交给大家去获取了。

def audio_word():
    APP_ID = ''
    API_KEY = ''
    SECRET_KEY = ''
    client = AipSpeech(APP_ID, API_KEY, SECRET_KEY)
    def get_file_content(filePath):
        with open(filePath, 'rb') as fp:
            return fp.read()
    ret = client.asr(get_file_content('01.wav'), 'wav', 16000, {'dev_pid': 1537, })
    print(ret)#获取识别到的文字

这里我没有做异常处理,来考验一下大家的能力,给大家链接让大家自己动手试一下,

这是百度的文档,和开放平台,需要使用的可以申请一个自己的应用试一下:

相关文档    http://ai.baidu.com/docs#/ASR-Online-Python-SDK/top

开放平台   https://console.bce.baidu.com/ai/#/ai/speech/app/detail~appId=608501

 

04—与机器人对话

好了,到这里了,我们的声音成功转化为文字,然后呢?

这次再调用第三方接口,做自动应答。

这里我调用的是图灵机器人,大家也可以去了解一下。

因为某些原因,这里我直接使用了平台对话框的聊天机器人,

如下(这里需要导入requests模块):

def tu_ling(text):

    url = "http://www.tuling123.com/robot-chat/robot/chat/227960/jwt7"
    data = {"perception": {"inputText": {"text": text}}, "userInfo": {"userId": "demo123"}}
    header = {
        "Referer": "http://www.tuling123.com/member/robot/1140264/center/frame.jhtml?page=0&child=0",
        "User-Agent": "Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/55.0.2883.87 UBrowser/6.2.4094.1 Safari/537.36"}
    tuling = requests.post(url, json=data, headers=header)
    conent = tuling.json()

我是不会告诉你,这里我使用的是爬虫的方式的搭建一个属于自己的语音对话机器人

 

05—文字转换为语音

好了,(敲黑板)重点,前年没有考,去年没有考,今年一定考

我们要把文字转换为语音,使用输出设备输出,怎么弄?

怎么办?再导入一个模块呀!

pip install Pywin32

导入成功之后,我安装的时候,pywin32好像是python2的代码,需要修改几个地方,让它支持python3

然后就是调用

import win32com.client
speaker = win32com.client.Dispatch("SAPI.SpVoice")
speaker.Speak("我是语音助手,小灵!")

好了我们的语音伙伴就这么搞定了。

分解开来看,感觉是不是非常简单呢!还等什么,自己也制造一个吧!

 

相关推荐:

自动操作浏览器之–无界面selenium爬虫

自动打开浏览器,自动进行操作

python实现祝福弹框

微信自动添加好友

python爬虫教程

 

 

在公众号后台回复  :    “语音机器人”   获取完整代码,以及有关的插件。

 

欢迎关注我们哟!

 

搭建一个属于自己的语音对话机器人

 

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/111420.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 2020年9月-PHP面试题整理

    2020年9月-PHP面试题整理

  • Sql Prompt使用技巧[通俗易懂]

    Sql Prompt使用技巧[通俗易懂]1、刷新缓存打开SqlServer,该插件会自动运行,将数据库中的视图、表、存储过程都缓存起来,所以在第一次打开查询分析器的时候,插件会有一个加载缓存的过程。如果数据库中的对象有变化,需要手动刷新一下缓存,可以按Ctrl+Shift+D,或者在主菜单中找到SQLPrompt→RefreshSuggestions。2、智能提示(1)在查询分析器中写DML语句时,当鼠标移动到…

  • python垃圾回收机制(引用计数)

    python垃圾回收机制(引用计数)在Python中,垃圾回收机制主要是以引用计数为主要手段,以标记清除和分代回收机制作为辅助手段实现的

  • Ubuntu安装Redis及使用「建议收藏」

    Ubuntu安装Redis及使用「建议收藏」NoSQL简介NoSQL,全名为NotOnlySQL,指的是非关系型的数据库随着访问量的上升,网站的数据库性能出现了问题,于是nosql被设计出来优点/缺点优点:高可扩展性分布式计算低成本架构的灵活性,半结构化数据没有复杂的关系缺点:没有标准化有限的查询功能(到目前为止)最终一致是不直观的程序分类类型部分代表特点列存储H…

  • Ansi,UTF8,Unicode,ASCII编码的差别

    Ansi,UTF8,Unicode,ASCII编码的差别

    2021年11月15日
  • Java 异常之 RuntimeException和Exception的区别

    Java 异常之 RuntimeException和Exception的区别在java的异常类体系中,Error和RuntimeException是非检查型异常,其他的都是检查型异常。所有方法都可以在不声明throws的情况下抛出RuntimeException及其子类不可以在不声明的情况下抛出非RuntimeException简单的说,非RuntimeException必要自己写catch块处理掉。RuntimeExce

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号