Apple досліджує, як ШІ може передбачати баги, створювати тести та виправляти код

Apple

Apple опублікувала три нові дослідження, які демонструють потенціал штучного інтелекту в розробці програмного забезпечення — від виявлення помилок у коді до автоматичної генерації тестів і навіть самостійного виправлення багів. Ці інструменти можуть суттєво покращити ефективність роботи розробників і QA-інженерів. Про це пише 9to5Mac.

ADE-QVAET: ШІ для передбачення помилок

Модель ADE-QVAET поєднує кілька сучасних AI-методів, щоб точніше передбачати помилки в коді. Вона не читає код напряму, а аналізує його характеристики — наприклад, складність і структуру — та виявляє, де ймовірно можуть бути баги. Завдяки цьому система досягла дуже високої точності (98,1%) і змогла краще за традиційні методи визначати справжні помилки, майже не видаючи хибних спрацювань.

Agentic RAG: Автоматизоване створення тестів

Друге дослідження показує, як штучний інтелект може автоматично створювати тести для програм, економлячи час і ресурси. Розроблена система генерує тест-плани, сценарії та звіти без участі людини, зберігаючи зв’язок між вимогами і результатами. Під час тестування в корпоративних середовищах вона підвищила точність до 94,8%, скоротила час перевірки на 85% і пришвидшила запуск проєктів на два місяці, що демонструє великий потенціал для використання в бізнесі.

SWE-Gym: Навчання AI агентів писати та виправляти код

Програмний код

Третє дослідження стосується AI-агентів, які навчаються самостійно читати, виправляти та перевіряти код. Для цього Apple створила спеціальне середовище SWE-Gym з тисячами реальних завдань на Python, які містять тести для перевірки результату. У ході випробувань агенти правильно розв’язали 72,5% задач, що на 20% краще за попередні моделі. Також була створена спрощена версія SWE-Gym Lite, яка скорочує час навчання майже вдвічі, зберігаючи при цьому високу точність, що робить її зручною для швидких перевірок і тестування.


Телеграм double.newsТелеграм double.news

Схожі Новини
Люди почали шукати роботу в Tinder замість LinkedIn

Люди почали шукати роботу в Tinder замість LinkedIn

У період нестабільного ринку праці частина кандидатів почала використовувати нетрадиційні канали для пошуку роботи. Деякі фахівці розповідають, що знаходили клієнтів, рекомендації та навіть співбесіди через застосунки для знайомств зокрема Tinder, Hinge та Grindr.
Детальніше
Samsung

Samsung показала функцію “Приватного дисплея” у Galaxy S26 Ultra перед анонсом

Samsung в короткому промо-ролику продемонструвала роботу нової функції Privacy Display для флагмана Samsung Galaxy S26 Ultra. Технологія дозволяє приховувати вміст екрана від сторонніх, які дивляться під кутом, не впливаючи на якість зображення для власника пристрою.
Детальніше
RTX 5090 MSI Suprim

У Туреччині молодятам на весіллі подарували оперативну пам’ять і RTX 5090

Дефіцит пам’яті та відеокарт на глобальному ринку, схоже, не шкодує нікого, навіть молодят. На одному з весіль у Туреччині гості відмовилися від традиційних подарунків на кшталт прикрас чи грошових конвертів і обрали більш сучасний формат: нареченим вручили відеокарту GeForce RTX 5090 та комплект оперативної пам’яті DDR5.
Детальніше