Фьючерсы
Доступ к сотням фьючерсов
CFD
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Введение в торговлю фьючерсами
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Pre-IPOs
Откройте полный доступ к глобальным IPO акций
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
Рекламные акции
AI
Gate AI
Ваш универсальный AI-ассистент для любых задач
Gate AI Bot
Используйте Gate AI прямо в вашем социальном приложении
GateClaw
Gate Синий Лобстер — готов к использованию
Gate for AI Agent
AI-инфраструктура: Gate MCP, Skills и CLI
Gate Skills Hub
Более 10 тыс навыков
От офиса до трейдинга: единая база навыков для эффективного использования ИИ
GateRouter
Умный выбор из более чем 40 моделей ИИ, без дополнительных затрат (0%)
Xiaomi открыла исходный код OmniVoice: модель, охватывающая 646 языков для голосового клонирования, полностью основанная на открытых данных, превосходящая коммерческие системы
Согласно мониторингу Beating, команда нового поколения Kaldi лаборатории искусственного интеллекта Xiaomi выпустила OmniVoice — модель TTS (текст в речь), поддерживающую 646 языков и основанную на нулевом образце голосового клонирования. За несколько секунд с помощью референсного аудио можно клонировать голос, даже между языками: предоставьте запись на китайском, и модель сможет говорить на японском, корейском или других языках тем же голосом. Весь код, веса и обучающие данные открыты, лицензия Apache-2.0.
В архитектуре OmniVoice придерживается минималистского подхода. Вся модель состоит из одного двунаправленного трансформера, который напрямую отображает текст в многокодовые акустические токены (дискретное кодирование звука), без двухэтапной цепочки — сначала семантический токен, затем акустический. Два ключевых элемента обеспечивают простую структуру: стратегия случайного маскирования всех кодов для повышения эффективности обучения, и инициализация с помощью предобученных параметров больших языковых моделей для повышения точности произношения. Скорость вывода в 40 раз превышает реальное время, работает прямо на PyTorch без дополнительных оптимизаций.
Обучающие данные взяты из 50 открытых наборов голосовых данных, после шумоподавления и отбора качества всего собрано 580 тысяч часов. Для малоресурсных языков используется динамическое увеличение выборки для обеспечения качества обучения. В тестах на 24 языках голос OmniVoice превосходит по сходству и разборчивости несколько коммерческих систем. В тестах на 102 языках разборчивость приближается или превосходит реальную запись. Даже языки с менее чем 10 часами данных могут быть синтезированы.
Помимо голосового клонирования, модель поддерживает настройку тембра по текстовому описанию (например, «мужчина, средний возраст, очень низкий тон» или «женщина, молодой, сычуаньский диалект»), автоматическое шумоподавление по звуковой подсказке, вставку интонационных символов, таких как смех или вздох, а также исправление произношения сложных китайских и английских омонимов и собственных имен.