A Microsoft lançou o VibeVoice, um novo modelo de texto-para-fala de código aberto. Ele pode criar áudios longos, lidando com até 90 minutos de conversas com múltiplos falantes com apenas 1,5 bilhões de parâmetros.
Esta página pode conter conteúdos de terceiros, que são fornecidos apenas para fins informativos (sem representações/garantias) e não devem ser considerados como uma aprovação dos seus pontos de vista pela Gate, nem como aconselhamento financeiro ou profissional. Consulte a Declaração de exoneração de responsabilidade para obter mais informações.
12 gostos
Recompensa
12
5
Republicar
Partilhar
Comentar
0/400
RegenRestorer
· 08-30 15:08
A Microsoft finalmente despertou.
Ver originalResponder0
RugDocDetective
· 08-30 15:07
Muito forte, muito forte! Quando vai bombear uma onda?
Ver originalResponder0
FancyResearchLab
· 08-30 15:05
É apenas mais um brinquedo de laboratório~
Ver originalResponder0
FOMOmonster
· 08-30 14:56
Está fenomenal, mais um grande rei no mundo do TTS.
Ver originalResponder0
LiquidationWatcher
· 08-30 14:41
A inteligência artificial já está tão competitiva?
A Microsoft lançou o VibeVoice, um novo modelo de texto-para-fala de código aberto. Ele pode criar áudios longos, lidando com até 90 minutos de conversas com múltiplos falantes com apenas 1,5 bilhões de parâmetros.