Python文本转语音引擎pyttsx3使用详解:从入门到精通的完全指南

Python使用总结之Python文本转语音引擎:pyttsx3完全指南

在开发需要语音输出功能的应用时,文本转语音(TTS)技术是一个非常有用的工具。Python的pyttsx3库提供了一个简单且离线的方式来实现这一功能,无需依赖互联网连接或外部API。本文将详细介绍pyttsx3的安装、基础使用以及高级功能,帮助你快速掌握这一实用工具。

什么是pyttsx3?

pyttsx3是一个跨平台的Python文本转语音转换库,它可以在不需要网络连接的情况下工作。该库使用你系统上已安装的TTS引擎,如Windows上的SAPI5、macOS上的NSS和Linux上的espeak。

安装

安装pyttsx3非常简单,只需使用pip命令:

pip install pyttsx3

在某些系统上,可能还需要安装额外的依赖:

Windows:通常不需要额外安装(使用SAPI5)
macOS:可能需要安装PyObjC

pip install pyobjc

Linux:需要安装espeak

sudo apt-get install espeak

基本使用

初始化引擎并说话

以下是使用pyttsx3的最简单示例:

import pyttsx3

# 初始化TTS引擎
engine = pyttsx3.init()

# 设置要说的文本
engine.say("你好,我是Python文本转语音引擎")

# 运行并等待语音完成
engine.runAndWait()

调整语音属性

1. 改变语速

语速以每分钟字数(WPM)衡量,默认值通常为200:

# 获取当前语速
rate = engine.getProperty('rate')
print(f"当前语速:{rate}")

# 设置新的语速 (降低50%)
engine.setProperty('rate', rate-100)

engine.say("这是降低语速后的语音效果")
engine.runAndWait()
2. 改变音量

音量范围从0.0到1.0:

# 获取当前音量
volume = engine.getProperty('volume')
print(f"当前音量:{volume}")

# 设置新的音量 (0.0 到 1.0)
engine.setProperty('volume', 0.7)  # 70%音量

engine.say("这是调整音量后的语音效果")
engine.runAndWait()
3. 更改声音

pyttsx3允许使用系统上可用的不同声音:

# 获取可用声音的列表
voices = engine.getProperty('voices')

# 打印可用声音的信息
for i, voice in enumerate(voices):
    print(f"语音{i}:")
    print(f" - ID: {voice.id}")
    print(f" - 名称: {voice.name}")
    print(f" - 语言: {voice.languages}")
    print(f" - 性别: {voice.gender}")
    print(f" - 年龄: {voice.age}")

# 设置第二个声音(如果有的话)
if len(voices) > 1:
    engine.setProperty('voice', voices[1].id)
    engine.say("这是使用另一个声音的效果")
    engine.runAndWait()

高级功能

将语音保存为文件

除了直接播放语音外,pyttsx3还可以将语音保存为音频文件:

engine = pyttsx3.init()

# 设置要保存的文本
text = "这段文本将被保存为音频文件"

# 保存为WAV文件
engine.save_to_file(text, 'output.wav')
engine.runAndWait()

使用事件回调

pyttsx3提供了事件回调机制,可以在语音开始、结束或发生错误时执行特定操作:

def onStart(name):
    print(f'开始: {name}')

def onWord(name, location, length):
    print(f'词: {name}, 位置: {location}, 长度: {length}')

def onEnd(name, completed):
    print(f'结束: {name}, 完成: {completed}')

# 连接回调函数
engine = pyttsx3.init()
engine.connect('started-utterance', onStart)
engine.connect('started-word', onWord)
engine.connect('finished-utterance', onEnd)

engine.say('这段文本将触发回调函数')
engine.runAndWait()

多线程使用

在图形界面或需要非阻塞语音输出的应用中,可以在单独的线程中运行TTS引擎:

import threading
import time

def speak_in_thread(text):
    engine = pyttsx3.init()
    engine.say(text)
    engine.runAndWait()
    engine.stop()

# 创建一个线程来播放语音
speech_thread = threading.Thread(target=speak_in_thread, args=("这段文本将在单独的线程中播放,不会阻塞主程序",))
speech_thread.start()

# 主程序可以继续执行其他任务
print("语音播放已开始,但主程序继续执行")
for i in range(5):
    print(f"主线程计数: {i}")
    time.sleep(0.5)

# 等待语音线程结束
speech_thread.join()
print("语音播放完成")

实用示例

1. 简单的文本阅读器

import pyttsx3

def text_reader(file_path):
    try:
        with open(file_path, 'r', encoding='utf-8') as file:
            text = file.read()
            
        engine = pyttsx3.init()
        print("开始阅读文件...")
        engine.say(text)
        engine.runAndWait()
        print("文件阅读完成")
    except FileNotFoundError:
        print(f"错误: 找不到文件 '{file_path}'")
    except Exception as e:
        print(f"发生错误: {e}")

# 使用示例
text_reader('example.txt')

2. 简单的语音提醒工具

import pyttsx3
import time
import threading

class VoiceReminder:
    def __init__(self):
        self.engine = pyttsx3.init()
        self.reminders = []
        self.running = True
        self.check_thread = threading.Thread(target=self._check_reminders)
        self.check_thread.daemon = True
        self.check_thread.start()
    
    def add_reminder(self, message, minutes):
        reminder_time = time.time() + minutes * 60
        self.reminders.append((reminder_time, message))
        print(f"提醒已设置: '{message}' 将在 {minutes} 分钟后提醒")
    
    def _check_reminders(self):
        while self.running:
            current_time = time.time()
            # 检查是否有到期的提醒
            for i, (reminder_time, message) in enumerate(self.reminders[:]):
                if current_time >= reminder_time:
                    print(f"提醒: {message}")
                    self.engine.say(message)
                    self.engine.runAndWait()
                    # 删除已触发的提醒
                    self.reminders.pop(i)
            time.sleep(1)
    
    def stop(self):
        self.running = False
        self.check_thread.join(timeout=1)

# 使用示例
reminder = VoiceReminder()
reminder.add_reminder("该喝水了", 0.1)  # 6秒后提醒
reminder.add_reminder("休息一下眼睛", 0.2)  # 12秒后提醒

# 保持程序运行足够长的时间来触发提醒
time.sleep(15)
reminder.stop()

常见问题和解决方案

  1. No module named ‘win32com.client’
    解决方案: pip install pywin32

  2. No module named ‘pyttsx3’
    确保正确安装了pyttsx3: pip install pyttsx3

  3. 无法更改声音/找不到声音
    确保系统上安装了额外的TTS声音。在Windows上,可以在控制面板 > 语音识别 > 文本到语音中添加额外的声音。

  4. Linux上没有声音输出
    确保安装了espeak: sudo apt-get install espeak

  5. 速度调整不起作用
    尝试更大范围的调整,某些引擎对小幅度调整不敏感。

总结

pyttsx3是一个功能强大且易于使用的Python文本转语音库,它提供了语音合成的核心功能,同时保持了简单的API。它的离线特性使其成为需要TTS功能但不想依赖网络服务的应用的理想选择。

通过本教程,你应该已经掌握了pyttsx3的基本用法和一些高级技巧。你可以将这些知识应用到各种项目中,例如辅助技术、语言学习应用、语音通知系统或任何需要语音输出的应用程序。

希望这篇教程对你有所帮助!如果你有任何问题或遇到困难,不要犹豫,查阅官方文档或在相关论坛上寻求帮助。

祝你的Python TTS项目顺利!

作者:阿福不是狗

物联沃分享整理
物联沃-IOTWORD物联网 » Python文本转语音引擎pyttsx3使用详解:从入门到精通的完全指南

发表回复