Дослідники Apple представили новий підхід до роботи штучного інтелекту, який суттєво покращує здатність великих мовних моделей до логічних міркувань та генерації коду. Ця інновація не стосується створення нової нейронної мережі, а змінює сам алгоритм «мислення» існуючих систем, роблячи їхні відповіді точнішими та стабільнішими.

У науковій роботі LaDiR описано унікальний фреймворк, що поєднує два методи: дифузійний та авторегресивний. Дифузійні моделі дозволяють паралельно обробляти кілька варіантів розв'язання, поступово уточнюючи результат, тоді як класичний авторегресивний підхід будує фінальну відповідь послідовно, токен за токеном.

Фото до матеріалу: Apple представила новий підхід до «мислення» штучного інтелекту

Ключова перевага нового методу полягає в тому, що він дозволяє моделі одночасно розглядати різні сценарії вирішення задачі. Кожен варіант починається як випадковий шум і трансформується в логічно узгоджений крок, що забезпечує більшу різноманітність та якість результатів порівняно з традиційними алгоритмами.

Після того як система обирає найкращий напрямок міркування, вона переходить до етапу фінальної генерації. Важливо, що LaDiR працює поверх вже існуючих моделей, не замінюючи їх повністю, а лише оптимізуючи процес прийняття рішень на рівні логіки.

У практичних тестах цей підхід продемонстрував помітні результати. При використанні моделей LLaMA 3.1 та Qwen3-8B система показала вищу точність у математичних задачах, плануванні та написанні коду, особливо в складних логічних головоломках.

Попри технічну складність реалізації, ця робота ілюструє новий вектор розвитку штучного інтелекту. Замість простого збільшення розміру моделей, розробники шукають способи зробити їхнє «мислення» гнучкішим, ефективнішим та здатним до кращого аналізу проблем.