Україна
Штучний інтелект вперся у стелю: експерт розкрив новий вектор розвитку технологій
Директор департаменту ШІ компанії Sponge Анар Лавренов заявив, що сучасні мовні моделі досягли технологічної межі, і індустрія переходить до створення агентських систем.
Сучасні великі мовні моделі (LLM) вперлися у технологічну стелю, і індустрія штучного інтелекту змушена шукати нові шляхи розвитку. Про це заявив директор департаменту ШІ компанії Sponge Анар Лавренов, наголосивши, що ера архітектури трансформерів наближається до свого піку. Замість пошуку нових архітектурних рішень, провідні розробники перенаправляють зусилля на створення агентських систем, здатних інтегрувати LLM у реальне середовище взаємодії.
За словами експерта, поява таких моделей, як GPT 3.5, стала значним кроком завдяки переходу від рекурентних моделей до трансформерів. Проте зараз світ очікує на нові архітектури, які зможуть перевершити існуючі технології. Компанія Anthropic, яка є лідером у цій сфері, вже впровадила протокол MCP (Model Context Protocol), що перетворює мовні моделі на повноцінних асистентів для виконання складних завдань.
Процес навчання штучного інтелекту складається з трьох ключових етапів, які визначають кінцевий результат. Перший етап передбачає передбачення наступного слова на величезних обсягах тексту, де моделі, як-от Claude, використовують техніку реструктуризованого переднавчання. Другий етап — це навчання з учителем, де моделі вчаться на прикладах запитань та відповідей. Третій і найважливіший етап — це вирівнювання (alignment) або навчання з підкріпленням, що безпосередньо впливає на поведінку системи.
Анар Лавренов підкреслив, що всі сучасні моделі на 90% використовують однакові дані, тому різниця між ними полягає переважно в техніках навчання та методах подачі інформації. Вузькі домени можуть демонструвати відмінності лише на рівні 5-10%. Окрім цього, важливу роль відіграють методи оптимізації, такі як DPO, представлений командою Anthropic, які сприяють покращенню якості моделей.
Наступним етапом розвитку штучного інтелекту стане вдосконалення агентських систем, які інтегрують LLM у повсякденне життя. Цей перехід може кардинально змінити способи виконання завдань у бізнесі, освіті та науці, оскільки акцент зміщується на взаємодію та інтеграцію технологій у існуючі процеси. Компанії намагаються знайти нові підходи до використання LLM, щоб адаптуватися до нових реалій ринку.
Читайте також
- Тарас Барщовський презентує Malva: новий AI-інструмент для продажів, що виходить на ринок США
- Дані — нова руда: як ШІ змінює бізнес-стратегії в українській металургії
- Сергій Мартинчук очолив регіональний офіс Visa в Україні та 16 інших країнах
- Український стартап Harmix залучив $1 млн від канадських інвесторів для розвитку ШІ-платформи
- Apple змінює фінансову стратегію: новий CEO Джон Тернус зробить ставку на інновації
Новини цього розділу
Лідери цифровізації України визначили пріоритети на 2026 рік
SpaceX вивела на орбіту корейський супутник, запуск якого затримала війна в Україні
Епоха трансформерів добігає кінця: чому ШІ-моделі вийшли на технологічне плато
Наземні роботи повернулися на фронт: як НРК стали незамінними в логістиці
Wix розширює команду в Україні та інвестує в безкодові застосунки
Український розробник презентував атмосферний екшен-платформер Distantia про гризунів на космічній станції
Український читач дізнався: як ютубер воскресив Apple Lisa замість $10 000
McLaren представила два гіперкари MCL-HY: один для Ле-Мана, інший — для приватних колекціонерів
Робот-екскурсовод R1 представлено в історичному палаці Турину
Діти обходять вікові обмеження онлайн: дослідження показало, що навіть намальовані вуси допомагають
Коментарі
Коментарів ще немає. Будьте першим у цій дискусії.