A Microsoft lançou o VibeVoice, um novo modelo de texto-para-fala de código aberto. Ele pode criar áudios longos, lidando com até 90 minutos de conversas com múltiplos falantes com apenas 1,5 bilhões de parâmetros.
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
12 Curtidas
Recompensa
12
6
Repostar
Compartilhar
Comentário
0/400
RegenRestorer
· 08-30 15:08
A Microsoft finalmente despertou.
Ver originalResponder0
RugDocDetective
· 08-30 15:07
Muito forte, muito forte! Quando vai bombear uma onda?
Ver originalResponder0
FancyResearchLab
· 08-30 15:05
É apenas mais um brinquedo de laboratório~
Ver originalResponder0
FOMOmonster
· 08-30 14:56
Está fenomenal, mais um grande rei no mundo do TTS.
Ver originalResponder0
LiquidationWatcher
· 08-30 14:41
A inteligência artificial já está tão competitiva?
A Microsoft lançou o VibeVoice, um novo modelo de texto-para-fala de código aberto. Ele pode criar áudios longos, lidando com até 90 minutos de conversas com múltiplos falantes com apenas 1,5 bilhões de parâmetros.