【开源项目】Python 免费文生音频 TTS 方案实战测评:gTTS、edge_tts 与 pyttsx3 效果对比

玩技站长
玩技站长
管理员, Keymaster
6928
文章
1
粉丝
软件头条评论86字数 735阅读2分27秒阅读模式

【开源项目】Python 免费文生音频 TTS 方案实战测评:gTTS、edge_tts 与 pyttsx3 效果对比

在python中,已经有很多TTS相关的包,可以拿来即用,以下是我整理的一些简单免费的方案,仅供参考:

方案1:gTTS

1.1 介绍

  • 利用google的免费文本转语音API服务
  • 需要能访问谷歌的网络环境
  • 一键安装,转换速度快,转换质量一般
  • 开源地址:https://github.com/pndurette/gTTS
    官方教程:https://gtts.readthedocs.io/en/latest/index.html

1.2 安装

pip install gTTS

1.3 简单使用

from gtts import gTTS
tts = gTTS(text='您好,我是一直可爱的小猪!', lang='zh')
tts.save('test.mp3')

1.4 效果展示

 

方案2:edge_tts

2.1 介绍

  • 利用微软的免费文本转语音API服务
  • 微软已禁止国内访问这个服务,需要外网环境
  • 一键安装,转换速度快,质量较好,可控选项多
  • 开源地址:https://github.com/rany2/edge-tts

2.2 安装

pip install edge_tts

2.3 简单使用

  • 可以通过命令edge-tts --list-voice列出所有支持的语音,以下是常用的中文语音:
    • zh-CN-XiaoxiaoNeural - 女声,自然
    • zh-CN-YunxiNeural - 男声,自然
    • zh-CN-YunyangNeural - 男声,新闻播报风格
    • zh-CN-XiaoxuanNeural - 女声,成熟
    • zh-CN-YunxiaNeural - 男声,少年
    • zh-CN-YunjianNeural - 男声,播报解说风格
    • zh-HK-WanLungNeural - 男生,粤语
  • 代码示例:
    import asyncio
    import edge_tts
    async def ttsWork(text, file_path, voice="zh-CN-YunxiNeural", rate="+0%", volume="+0%", proxy=None):
        communicator = edge_tts.Communicate(
            text,  # 需要转换的文本
            voice=voice,  # 配音员口音
            rate=rate,  # 语速控制
            volume=volume,  # 音量控制
            proxy=proxy  # 请求代理设置
        )
        await communicator.save(file_path)
    #国内环境需要设置有效的proxy,国外服务器则不需要配置proxy
    asyncio.run(ttsWork("您好,我是一直可爱的小猪!", "test.mp3", proxy="http://127.0.0.1:10808"))

2.4 效果展示

  • 声音类型:zh-CN-XiaoxiaoNeural

     

  • 声音类型:zh-CN-YunxiNeural

     

  • 声音类型:zh-CN-YunyangNeural

     

  • 声音类型:zh-CN-XiaoxuanNeural

     

  • 声音类型:zh-CN-YunxiaNeural

     

  • 声音类型:zh-HK-WanLungNeural

     

方案3:pyttsx3

3.1 介绍

  • 跨系统使用,利用系统上安装的TTS引擎驱动
  • 不需要网络连接,完全离线使用
  • 安装简单,转换速度快,质量一般
  • 开源地址:https://github.com/nateshmbhat/pyttsx3

3.2 安装

window安装TTS引擎

无需处理,一般默认支持

linux(debian系列)安装TTS引擎

sudo apt update && sudo apt install espeak-ng libespeak1

macOS安装TTS引擎

略过,没有mac电脑

开始安装python包

pip install pyttsx3

3.3 简单使用

import pyttsx3
# 初始化语音引擎
engine = pyttsx3.init()
# 设置要说的文本
text = "您好,我是一直可爱的小猪!"
# 设置语速,默认值是200
engine.setProperty('rate', 100)
# 设置音量,默认值是1.0
engine.setProperty('volume', 1.0)
# 保存到文件
engine.save_to_file(text, 'test.wav')
engine.runAndWait()

3.4 效果展示

最后总结

  • 以上几种tts方案都能实现多种语言文本转语音的功能,但是微软是基于神经网络的tts,在可控性和质量上更胜一筹
  • 如果只是需要文本转语音功能,不要求语音质量,追求稳定性、低依赖,如读书场景、AI回答朗读,可以选择pyttsx3

 最后更新:2025-9-14
匿名

发表评论

匿名网友
确定

拖动滑块以完成验证