语音合成
自己搭建服务
MegaTTS3
github: https://github.com/azhida/MegaTTS3
MegaTTS3 是由字节跳动推出的一款超大规模语音合成模型,参数量高达 450亿 ,是目前业内最强大的 TTS 模型之一。相比于前代产品,MegaTTS3 在多个维度上实现了质的飞跃:
- 1、高自然度语音生成 :通过深度学习和大规模数据训练,MegaTTS3 能够生成与真人几乎无异的高质量语音,语调、节奏和情感表达都非常接近人类。
- 2、多语言支持 :MegaTTS3 支持多种语言,包括但不限于中文、英文、法语、西班牙语等,满足全球化需求。
- 3、个性化定制 :用户可以通过简单的语音样本上传,快速生成专属的个性化语音模型,适用于虚拟助手、有声读物、游戏配音等多种场景。
- 4、高效推理速度 :尽管参数量庞大,MegaTTS3 在推理效率上进行了优化,能够在消费级硬件上实现快速响应。
Fish-Speech
github: https://github.com/fishaudio/fish-speech
需要 python conda 环境。 需要安装 Anaconda。
node-edge-tts
注意:需要在 nodejs 服务端使用,因为它并不直接支持浏览器使用!
edge-tts-openai-cf-worker
github: https://github.com/dongwen88/edge-tts-openai-cf-worker
免费在线工具
TTSMaker
支持50+种全球语言300+语音包风格 无广告 支持调整语速、设置音量、插入停顿,可以添加背景音乐 除了网页版还支持PC客户端
Text to Speech Im
支持50多个国家或地区的语言和8000多种音色 用户可以调整语速和音量 无广告
Text to Speech Online
官网:https://texttospeech.online/
超过409种逼真的声音、129种语言和方言
Luvvoice
支持超过 200 种声音和 70 种语言 有页面广告
Narakeet
官网:https://www.narakeet.com/app/text-to-audio/
无需注册,支持多种普通话变体和其他地区的中文变体 无广告 用户可以调整语速和音量
Bingal AI
官网:https://ai.bingal.com/cn/ai-tts/
没有广告,简单洁净的在线工具
云猫转码
官网:https://yunmaovideo.com/tts
需要登录,免费用户单次输入上限 3000 字(有小程序端)
AI在线转换
官网:https://www.zaixianai.cn/voiceCompose
需要登录,单次输入上限 3000 字
Text Reader
支持的音色的语言相对较少
Clipchamp
这其实是微软出品的一个在线剪辑工具,支持语音转文字
ChatTTS
ChatTTS是专门为对话场景设计的文本转语音模型,例如LLM助手对话任务。它支持英文和中文两种语言。每次最多可以生成 30s的语音;生成的音色非常逼真,网上目前很火,可以玩玩。