Компанія OpenAI офіційно представила новий набір інструментів для розробників, які дозволяють створювати голосові додатки зі штучним інтелектом, що працюють у реальному часі. Цей крок відкриває нові можливості для українських розробників та бізнесу, дозволяючи впроваджувати більш природні та швидкі голосові інтерфейси.

Ключовою частиною оновлення стали три нові моделі, доступні через API Realtime: GPT-Realtime-2, GPT-Realtime-Translate та GPT-Realtime-Whisper. Вони забезпечують не лише розпізнавання мовлення, а й миттєвий переклад та транскрипцію з низькою затримкою, що робить спілкування з ботами майже невідмінним від розмови з людиною.

Особливу увагу приділено моделі GPT-Realtime-2, яка орієнтована на складні сценарії. Вона здатна викликати зовнішні інструменти, виправляти власні помилки, обробляти кілька запитів одночасно та працювати з великим контекстом до 128K токенів. Модель також вміє адаптувати тон відповідей та налаштовувати глибину мислення під конкретні задачі.

Для міжмовного спілкування призначена модель GPT-Realtime-Translate, яка підтримує переклад у реальному часі для понад 70 мов введення та 13 мов виведення, зберігаючи при цьому контекст і зміст розмови. Третя модель, GPT-Realtime-Whisper, відповідає за потокову транскрипцію мовлення в текст, що є критично важливим для створення доступних сервісів.

Вартість використання нових функцій залежить від типу моделі та може бути розрахована як за погодинною ставкою, так і за кількістю оброблених аудіотокенів. Це дозволяє бізнесу гнучко масштабувати рішення залежно від навантаження та потреб користувачів.

Запуск цих інструментів може суттєво вплинути на розвиток українського IT-ринку, особливо в сферах освіти, підтримки клієнтів та розважальних додатків, де голосова взаємодія стає все більш затребуваною.