Україна
Xiaomi представила універсальну модель клонування голосу OmniVoice для 646 мов
Китайський гігант Xiaomi відкрив доступ до нової штучної інтелектуальної системи OmniVoice, здатної клонувати голоси та перекладати їх на 646 мов світу, включаючи рідкісні діалекти.
Компанія Xiaomi офіційно запустила модель штучного інтелекту OmniVoice, яка дозволяє клонувати голоси та перекладати їх на 646 мов світу. Унікальність розробки полягає у підтримці найрідкісніших мов, для яких традиційно майже не існує навчальних даних, що робить технологію безпрецедентною для глобальної локалізації контенту.
В основі системи лежить 580 тисяч годин аудіозаписів, зібраних з 50 відкритих наборів даних різними мовами. Для забезпечення коректної вимови складних слів та фраз модель використовує великі мовні моделі за принципом, схожим на роботу ChatGPT. Це дозволяє досягти високої природності звучання навіть при роботі з екзотичними діалектами.
Ключовою функцією OmniVoice є клонування голосу з будь-якого короткого зразка. Користувачеві достатньо записати голос людини, і система відтворить його іншою мовою, зберігаючи інтонацію та тембр. Окрім цього, інструмент дозволяє описати бажаний голос текстом, наприклад, «чоловік середнього віку з низьким голосом», і отримати синтезований результат.
Технологія також підтримує додавання емоційних відтінків, таких як сміх, зітхання або шепіт, що робить синтез більш живим. Додатково вбудовані функції виправлення неправильної вимови та очищення фонових шумів перетворюють OmniVoice на потужний інструмент не лише для генерації, а й для професійного редагування аудіо.
Код моделі, навчальні дані та готові ваги вже розміщені у відкритому доступі на платформах GitHub та Hugging Face. Будь-хто може протестувати демоверсію без встановлення додаткового програмного забезпечення, що відкриває широкі можливості для розробників та контент-мейкерів по всьому світу.
Читайте також
- Perplexity відкрила доступ до свого ШІ-асистента Personal Computer для всіх користувачів Mac
- Anthropic навчила ШІ-агентів «бачити сни»: що це означає для розробників
- Xiaomi розпочала тестування Android 17: які смартфони отримають оновлення до HyperOS 3.3
- 58% українських програмістів щодня використовують ШІ для кодування: результати дослідження
- Airbnb: ШІ генерує 60% нового коду, але чат-боти ще не готові до бронювань
Новини цього розділу
Nothing презентує сині навушники Ear (open): дебют 11 травня
Ціна на PlayStation 5 зросла на 100 доларів, а продажі впали на 46%: що це означає для українських геймерів
Дмитро Дубілет створив власний застосунок RoaryAI за допомогою Claude Code
Alibaba впроваджує ШІ-агентів у Taobao: ера діалогового шопінгу
Apple тестує AirPods із камерами для штучного інтелекту: що відомо про новинку
Instagram масово видала фейки: зірки втратили мільйони підписників
Hisense представила універсальний монітор GX Ultra з подвійним режимом роботи
Вінницькі студенти здобули золото на міжнародній олімпіаді зі штучного інтелекту в медицині
США терміново переглядають правила ШІ через модель Mythos, що здатна зламувати системи
Як за 5 хвилин очистити пам'ять смартфона та прибрати гальма: поради для українців
Коментарі
Коментарів ще немає. Будьте першим у цій дискусії.