爆火开源TTS，支持零样本克隆，200ms超低延迟，情感语调超自然。

安爸 • 1 年前 • 17 阅读

最近TTS的开源项目大爆发了吗？

看了好多，有亮点的慢慢给大家推荐，具体用哪个得看你实际应用场景了。

TTS的开源项目本来就挺多的，我们最近有个项目也在用，选起来真是费时费力。

尽可能的多帮大家找一些，帮大家省一些去找项目和对比的时间。

一共有4个型号。

扫码加入AI交流群

获得更多技术支持和交流

（请注明自己的职业）

项目简介

Orpheus TTS 是一个基于 Llama – 3b 架构的开源文本转语音工具。它能生成自然流畅、情感丰富的说话音频，支持零样本语音克隆，可通过简单标签控制语音情感和语调，且低延迟非常低适合实时输出场景。项目提供英语和多语言模型，包含预训练和微调版本。

DEMO

功能特点

出色的语音合成能力

多种模型选择

推理方式

模型训练

微调模型：过程简单，类似使用 Trainer 和 Transformers 微调 LLM，约 50 个示例可见效果，300 个示例 / 说话人效果最佳。
预训练模型：与训练 LLM 类似，不建议使用合成数据训练，提供详细训练说明。

项目链接

https://github.com/canopyai/Orpheus-TTS

关注「开源AI项目落地」公众号

（文：开源AI项目落地）