python录音并调用百度语音识别接口的示例

脚本专栏 2026/6/20 佚名

3 2 1

#！/usr/bin/env python
import requests
import json
import base64
import pyaudio
import wave
import os
import psutil


#首先配置必要的信息
def bat(voice_path):
  baidu_server = 'https://aip.baidubce.com/oauth/2.0/token"wate_play"
  #读取文件二进制内容
  f_obj = open(FILE_NAME, 'rb')
  content = base64.b64encode(f_obj.read())  # 百度语音识别需要base64编码格式
  speech = content.decode("utf-8")
  size = os.path.getsize(FILE_NAME)

  #json封装
  datas = json.dumps({
    'format': FILE_TYPE,
    'rate': VOICE_RATE,
    'channel': 1,
    'cuid': CUID,
    'token': token,
    'speech': speech,
    'len': size,
    "dev_pid":"1536"
  })
  return datas

#设置headers和请求地址url
def post(datas):
  headers = {'Content-Type':'application/json'}
  url = 'https://vop.baidu.com/server_api'
  # url = "http://vop.baidu.com/server_api"

  #用post方法传数据
  request = requests.post(url, datas, headers)
  result = json.loads(request.text)
  text = result.get("result")
  if result['err_no'] == 0:
    return text
  else:
    return "Error"


def get_audio(filepath):
  input("回车开始录音 >")   #输出提示文本，input接收一个值,转为str，赋值给aa
  CHUNK = 256         #定义数据流块
  FORMAT = pyaudio.paInt16  #量化位数（音量级划分）
  CHANNELS = 1        # 声道数;声道数：可以是单声道或者是双声道
  RATE = 8000        # 采样率;采样率：一秒内对声音信号的采集次数，常用的有8kHz, 16kHz, 32kHz, 48kHz, 11.025kHz, 22.05kHz, 44.1kHz
  RECORD_SECONDS = 5     #录音秒数
  WAVE_OUTPUT_FILENAME = filepath   #wav文件路径
  p = pyaudio.PyAudio()        #实例化

  stream = p.open(format=FORMAT,
          channels=CHANNELS,
          rate=RATE,
          input=True,
          frames_per_buffer=CHUNK)
  print("*"*10, "开始录音：请在5秒内输入语音")
  frames = []                         #定义一个列表
  for i in range(0, int(RATE / CHUNK * RECORD_SECONDS)):   #循环，采样率11025 / 256 * 5
    data = stream.read(CHUNK)                #读取chunk个字节 保存到data中
    frames.append(data)                   #向列表frames中添加数据data
  # print(frames)
  print("*" * 10, "录音结束\n")

  stream.stop_stream()
  stream.close()     #关闭
  p.terminate()      #终结

  wf = wave.open(WAVE_OUTPUT_FILENAME, 'wb')         #打开wav文件创建一个音频对象wf，开始写WAV文件
  wf.setnchannels(CHANNELS)                  #配置声道数
  wf.setsampwidth(p.get_sample_size(FORMAT))         #配置量化位数
  wf.setframerate(RATE)                    #配置采样率
  wf.writeframes(b''.join(frames))              #转换为二进制数据写入文件
  wf.close()       #关闭
  return


def check_disk():
  list_drive = psutil.disk_partitions() # 找出本地磁盘列表，保存的是结构体对象
  list_disk = []
  for drive in list_drive:
    list_disk.append(drive.device)
  return list_disk


if __name__ == '__main__':
  list_disk = check_disk() # 检索本地磁盘
  dirname_path = os.path.join(list_disk[0], "voice") # 设置语音文件存放路径， 
                                  （mac os下需要自己定存储路径）
  if not os.path.exists(dirname_path):
    os.makedirs(dirname_path)

  filename = "voice.wav" # 定义语音文件名
  in_path = os.path.join(dirname_path, filename)

  get_audio(in_path) # 录音

  datas = bat(in_path) # 封装百度语音识别需要的配置信息，返回请求头
  res = post(datas) # 连接百度语音识别接口，得到识别结果
  print("识别结果：",res[0])

实现效果：

在上述代码中，需要装到requests、psutil、pyaudio等库，其中pyaudio这个库在python3环境下装比较特殊，

windows环境下具体步骤如下：

第一步：下载whl文件支持

url：https://www.lfd.uci.edu/~gohlke/pythonlibs/#pyaudio

注意：

下载自己python解释器对应版本的

不要下载错了，资源很多

第二步：打开cmd，cd 进入下载的whl所在目录

执行命令：pip install Twisted-18.7.0-cp36-cp36m-win_amd64.whl # 下载的什么版本，后面就跟什么版本

第三步：执行命令：pip install pyaudio 安装

如果本地同时装有python2和python3，想装到python3里可以在cmd命令里把 pip 改成 pip3 即可

mac os 下安装pyaudio步骤如下：

到这里就结束啦！

以上就是python录音并调用百度语音识别接口的示例的详细内容，更多关于python 录音并调用语音识别接口的资料请关注其它相关文章！

python,录音,python,语音识别,python,调用百度语音识别接口

标签：

python,录音,python,语音识别,python,调用百度语音识别接口

免责声明：本站文章均来自网站采集或用户投稿，网站不提供任何软件下载或自行开发的软件！如有用户或公司发现本站内容信息存在侵权行为，请邮件告知！ 858582#qq.com

白云城资源网 Copyright www.dyhadc.com

评论“python录音并调用百度语音识别接口的示例”

python录音并调用百度语音识别接口的示例

暂无“python录音并调用百度语音识别接口的示例”评论...

www.dyhadc.com 白云城资源网

129,905影音资源

244,626技术资源

111,817软件资源

578,645站长资源

最新文章

转载一个别人收藏的精典网站Ruby,HIBERNATE

2026/6/20

可与Spreadsheets媲美的在线表格系统:EditG

2026/6/20

cygwin使用心得

2026/6/20

脚本的DVD开发

2026/6/20

局域网设置自动配置脚本文件的写法与用途

2026/6/20

一句话新闻

苹果官宣WWDC 2024！预计会有大批AI功能 - 2026/6/20

3月27日消息，苹果宣布2024年全球开发者大会（WWDC）将于6月10日至6月14日举行，巧合的是，这次大会与端午假期重合。

苹果官方表示：

在线参加 Apple 每年规模最大的开发者盛会。亲眼见证 Apple 最新平台、技术和工具的发布。了解如何创建和改进你的 App 和游戏。与 Apple 设计师和工程师互动交流，与全球开发者社区建立联系。以上活动均免费在线举行。

探索各种新的工具、框架和功能，助力你打造出理想的 App 和游戏。通过视频讲座学习新技能，与 Apple 专家进行一对一会面，以推进你的项目，完善你的构思。

Swift Student Challenge 旨在支持和鼓舞下一代开发者、创作者和企业家。太平洋时间 3 月 28 日，我们将公布今年的获奖者名单。获奖者将有资格参加在 Apple Park 举办的特别活动。我们还会选出 50 名杰出获胜者，他们将受邀前往库比提诺，获得为期三天的非凡体验，包括参加 Apple Park 的特别活动。

python录音并调用百度语音识别接口的示例

python,录音,python,语音识别,python,调用百度语音识别接口

如何用PyPy让你的Python代码运行得更快

python 实现波浪滤镜特效

评论“python录音并调用百度语音识别接口的示例”

RTX 5090要首发性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

python录音并调用百度语音识别接口的示例

python,录音,python,语音识别,python,调用百度语音识别接口

如何用PyPy让你的Python代码运行得更快

python 实现波浪滤镜特效

评论“python录音并调用百度语音识别接口的示例”

RTX 5090要首发 性能要翻倍！三星展示GDDR7显存

更新日志

友情链接

RTX 5090要首发性能要翻倍！三星展示GDDR7显存