侯体宗的博客
  • 首页
  • Hyperf版
  • beego仿版
  • 人生(杂谈)
  • 技术
  • 关于我
  • 更多分类
    • 文件下载
    • 文字修仙
    • 中国象棋ai
    • 群聊
    • 九宫格抽奖
    • 拼图
    • 消消乐
    • 相册

基于python实现语音录入识别代码实例

Python  /  管理员 发布于 7年前   330

这篇文章主要介绍了如何通过python实现语音录入识别,文中通过示例代码介绍的非常详细,对大家的学习或者工作具有一定的参考学习价值,需要的朋友可以参考下

一、介绍

1.第一步录音存入本地

2.调用百度语音识别sdk

注意点:百度语音识别对声音源有要求,比特率必须是256kbps

二、代码

#安装必要库pip install baidu-aip #百度sdkpip install pyaudio
import waveimport pyaudiofrom aip import AipSpeechdef record(): # 定义数据流块 CHUNK = 1024 FORMAT = pyaudio.paInt16 # 想要百度识别,下面这两参数必须这样设置,使得比特率为256kbps CHANNELS = 1 RATE = 16000 # 录音时间 RECORD_SECONDS = 8 # 要写入的文件名 WAVE_OUTPUT_FILENAME = "output.wav" # 创建PyAudio对象 p = pyaudio.PyAudio() # 打开数据流 stream = p.open(format=FORMAT,     channels=CHANNELS,     rate=RATE,     input=True,     frames_per_buffer=CHUNK) print("* recording") # 开始录音 frames = [] for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):  data = stream.read(CHUNK)  frames.append(data) print("* done recording") # 停止数据流 stream.stop_stream() stream.close() # 关闭PyAudio p.terminate() # 写入录音文件 wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb') wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b''.join(frames)) wf.close()def ASR(): # 录音 record() """ 你的 APPID AK SK """ APP_ID = '****' API_KEY = '****' SECRET_KEY = '****' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) # 读取文件 def get_file_content(filePath):  with open(filePath, 'rb') as fp:   return fp.read() # 识别本地文件 res=client.asr(get_file_content('output.wav'), 'wav', 16000, {  'dev_pid': 1536, }) print(res)if __name__ == '__main__': ASR()

三、语音命令控制程序

import waveimport pyaudiofrom aip import AipSpeechimport win32apidef record(): # 定义数据流块 CHUNK = 1024 FORMAT = pyaudio.paInt16 # 想要百度识别,下面这两参数必须这样设置,使得比特率为256kbps CHANNELS = 1 RATE = 16000 # 录音时间 RECORD_SECONDS = 8 # 要写入的文件名 WAVE_OUTPUT_FILENAME = "output.wav" # 创建PyAudio对象 p = pyaudio.PyAudio() # 打开数据流 stream = p.open(format=FORMAT,     channels=CHANNELS,     rate=RATE,     input=True,     frames_per_buffer=CHUNK) print("* recording") # 开始录音 frames = [] for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):  data = stream.read(CHUNK)  frames.append(data) print("* done recording") # 停止数据流 stream.stop_stream() stream.close() # 关闭PyAudio p.terminate() # 写入录音文件 wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb') wf.setnchannels(CHANNELS) wf.setsampwidth(p.get_sample_size(FORMAT)) wf.setframerate(RATE) wf.writeframes(b''.join(frames)) wf.close()def ASR(): # 录音 record() """ 你的 APPID AK SK """ APP_ID = '****' API_KEY = '****' SECRET_KEY = '****' client = AipSpeech(APP_ID, API_KEY, SECRET_KEY) # 读取文件 def get_file_content(filePath):  with open(filePath, 'rb') as fp:   return fp.read() # 识别本地文件 res=client.asr(get_file_content('output.wav'), 'wav', 16000, {  'dev_pid': 1536, }) if not res.get("err_no"):  return res.get("result")[0] return res.get("err_no")def control(order): # 命令对应的程序路径 open_order={"打开QQ":r"C:\Program Files (x86)\Tencent\QQ\Bin\QQScLauncher.exe","打开记事本":r"D:\Notepad++\notepad++.exe","打开浏览器":r"C:\Users\ffm11\AppData\Roaming\360se6\Application\360se.exe"} res=open_order.get(order) if res:  # 参数1:用于指定父窗口句柄。当函数调用过程出现错误时,它将作为Windows消息窗口的父窗口  # 参数2:用于指定要进行的操作。  # “open”操作表示执行由lpFile参数指定的程序,或打开由lpFile参数指定的文件或文件夹;  # “print”操作表示打印由lpFile参数指定的文件;  # “explore”操作表示浏览由lpFile参数指定的文件夹。  # 参数3:用于指定要打开的文件名、要执行的程序文件名或要浏览的文件夹名。  # 参数4:若lpFile参数是一个可执行程序,则此参数指定命令行参数,否则此参数应为NULL.  # 参数5:若lpFile参数是一个可执行程序,则此参数指定程序窗口的初始显示方式,否则此参数应设置为0。  # 这个参数常用的常数:  # SW_HIDE 隐藏窗口,活动状态给令一个窗口  # SW_MINIMIZE 最小化窗口,活动状态给令一个窗口  # SW_RESTORE 用原来的大小和位置显示一个窗口,同时令其进入活动状态  # SW_SHOW 用当前的大小和位置显示一个窗口,同时令其进入活动状态  # SW_SHOWMAXIMIZED 最大化窗口,并将其激活  # SW_SHOWMINIMIZED 最小化窗口,并将其激活  # SW_SHOWMINNOACTIVE 最小化一个窗口,同时不改变活动窗口  # SW_SHOWNA 用当前的大小和位置显示一个窗口,不改变活动窗口  # SW_SHOWNOACTIVATE 用最近的大小和位置显示一个窗口,同时不改变活动窗口  win32api.ShellExecute(0, 'open', res, '', '', 1) else:  print("语音命令失败")if __name__ == '__main__': order=ASR() control(order.rstrip("。"))

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持。


  • 上一条:
    Python实现图像的垂直投影示例
    下一条:
    Python操作MySQL数据库实例详解【安装、连接、增删改查等】
  • 昵称:

    邮箱:

    0条评论 (评论内容有缓存机制,请悉知!)
    最新最热
    • 分类目录
    • 人生(杂谈)
    • 技术
    • linux
    • Java
    • php
    • 框架(架构)
    • 前端
    • ThinkPHP
    • 数据库
    • 微信(小程序)
    • Laravel
    • Redis
    • Docker
    • Go
    • swoole
    • Windows
    • Python
    • 苹果(mac/ios)
    • 相关文章
    • 在python语言中Flask框架的学习及简单功能示例(0个评论)
    • 在Python语言中实现GUI全屏倒计时代码示例(0个评论)
    • Python + zipfile库实现zip文件解压自动化脚本示例(0个评论)
    • python爬虫BeautifulSoup快速抓取网站图片(1个评论)
    • vscode 配置 python3开发环境的方法(0个评论)
    • 近期文章
    • 在go语言中使用api.geonames.org接口实现根据国际邮政编码获取地址信息功能(1个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf分页文件功能(0个评论)
    • gmail发邮件报错:534 5.7.9 Application-specific password required...解决方案(0个评论)
    • 欧盟关于强迫劳动的规定的官方举报渠道及官方举报网站(0个评论)
    • 在go语言中使用github.com/signintech/gopdf实现生成pdf文件功能(0个评论)
    • Laravel从Accel获得5700万美元A轮融资(0个评论)
    • 在go + gin中gorm实现指定搜索/区间搜索分页列表功能接口实例(0个评论)
    • 在go语言中实现IP/CIDR的ip和netmask互转及IP段形式互转及ip是否存在IP/CIDR(0个评论)
    • PHP 8.4 Alpha 1现已发布!(0个评论)
    • Laravel 11.15版本发布 - Eloquent Builder中添加的泛型(0个评论)
    • 近期评论
    • 122 在

      学历:一种延缓就业设计,生活需求下的权衡之选中评论 工作几年后,报名考研了,到现在还没认真学习备考,迷茫中。作为一名北漂互联网打工人..
    • 123 在

      Clash for Windows作者删库跑路了,github已404中评论 按理说只要你在国内,所有的流量进出都在监控范围内,不管你怎么隐藏也没用,想搞你分..
    • 原梓番博客 在

      在Laravel框架中使用模型Model分表最简单的方法中评论 好久好久都没看友情链接申请了,今天刚看,已经添加。..
    • 博主 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 @1111老铁这个不行了,可以看看近期评论的其他文章..
    • 1111 在

      佛跳墙vpn软件不会用?上不了网?佛跳墙vpn常见问题以及解决办法中评论 网站不能打开,博主百忙中能否发个APP下载链接,佛跳墙或极光..
    • 2016-10
    • 2016-11
    • 2018-04
    • 2020-03
    • 2020-04
    • 2020-05
    • 2020-06
    • 2022-01
    • 2023-07
    • 2023-10
    Top

    Copyright·© 2019 侯体宗版权所有· 粤ICP备20027696号 PHP交流群

    侯体宗的博客