Skip to content

语音合成

自己搭建服务

MegaTTS3

github: https://github.com/azhida/MegaTTS3

MegaTTS3 是由字节跳动推出的一款超大规模语音合成模型,参数量高达 450亿 ,是目前业内最强大的 TTS 模型之一。相比于前代产品,MegaTTS3 在多个维度上实现了质的飞跃:

  • 1、高自然度语音生成 :通过深度学习和大规模数据训练,MegaTTS3 能够生成与真人几乎无异的高质量语音,语调、节奏和情感表达都非常接近人类。
  • 2、多语言支持 :MegaTTS3 支持多种语言,包括但不限于中文、英文、法语、西班牙语等,满足全球化需求。
  • 3、个性化定制 :用户可以通过简单的语音样本上传,快速生成专属的个性化语音模型,适用于虚拟助手、有声读物、游戏配音等多种场景。
  • 4、高效推理速度 :尽管参数量庞大,MegaTTS3 在推理效率上进行了优化,能够在消费级硬件上实现快速响应。

‌Fish-Speech

github: https://github.com/fishaudio/fish-speech

需要 python conda 环境。 需要安装 Anaconda。

node-edge-tts

注意:需要在 nodejs 服务端使用,因为它并不直接支持浏览器使用!

edge-tts-openai-cf-worker

github: https://github.com/dongwen88/edge-tts-openai-cf-worker

免费在线工具

TTSMaker

官网:https://ttsmaker.cn/

支持50+种全球语言300+语音包风格 无广告 支持调整语速、设置音量、插入停顿,可以添加背景音乐 除了网页版还支持PC客户端

Text to Speech Im

官网:https://texttospeech.im/

支持50多个国家或地区的语言和8000多种音色 用户可以调整语速和音量 无广告

Text to Speech Online

官网:https://texttospeech.online/

超过409种逼真的声音、129种语言和方言

Luvvoice

官网:https://luvvoice.com/zh/

支持超过 200 种声音和 70 种语言 有页面广告

Narakeet

官网:https://www.narakeet.com/app/text-to-audio/

无需注册,支持多种普通话变体和其他地区的中文变体 无广告 用户可以调整语速和音量

Bingal AI

官网:https://ai.bingal.com/cn/ai-tts/

没有广告,简单洁净的在线工具

云猫转码

官网:https://yunmaovideo.com/tts

需要登录,免费用户单次输入上限 3000 字(有小程序端)

AI在线转换

官网:https://www.zaixianai.cn/voiceCompose

需要登录,单次输入上限 3000 字

Text Reader

官网:https://textreader.ai/

支持的音色的语言相对较少

Clipchamp

官网:https://app.clipchamp.com/

这其实是微软出品的一个在线剪辑工具,支持语音转文字

ChatTTS

https://chattts.com/zh

https://chattts.me/

ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。每次最多可以生成 30s的语音;生成的音色非常逼真,网上目前很火,可以玩玩。

参考

11个免费在线AI文字转语音工具