Dia - TTS 模型

https://github.com/nari-labs/dia

Dia 是一个 1.6B 参数的 TTS 模型,由Nari Labs创建。

可以直接从对话稿生成高度逼真的对话,并可以根据音频进行情感和语调控制。
可以产生笑声、咳嗽、清嗓子等声音。
提供了预训练模型检查点和推理代码,以加速研究。

目前仅支持英语生成

#AI #TTS #GitHub GitHub - nari-labs/dia: A TTS model capable of generating ultra-realistic dialogue in one pass.
 
 
Back to Top
OKHK