
Apple опублікувала три нові дослідження, які демонструють потенціал штучного інтелекту в розробці програмного забезпечення — від виявлення помилок у коді до автоматичної генерації тестів і навіть самостійного виправлення багів. Ці інструменти можуть суттєво покращити ефективність роботи розробників і QA-інженерів. Про це пише 9to5Mac.
ADE-QVAET: ШІ для передбачення помилок
Модель ADE-QVAET поєднує кілька сучасних AI-методів, щоб точніше передбачати помилки в коді. Вона не читає код напряму, а аналізує його характеристики — наприклад, складність і структуру — та виявляє, де ймовірно можуть бути баги. Завдяки цьому система досягла дуже високої точності (98,1%) і змогла краще за традиційні методи визначати справжні помилки, майже не видаючи хибних спрацювань.
Agentic RAG: Автоматизоване створення тестів
Друге дослідження показує, як штучний інтелект може автоматично створювати тести для програм, економлячи час і ресурси. Розроблена система генерує тест-плани, сценарії та звіти без участі людини, зберігаючи зв’язок між вимогами і результатами. Під час тестування в корпоративних середовищах вона підвищила точність до 94,8%, скоротила час перевірки на 85% і пришвидшила запуск проєктів на два місяці, що демонструє великий потенціал для використання в бізнесі.
SWE-Gym: Навчання AI агентів писати та виправляти код

Третє дослідження стосується AI-агентів, які навчаються самостійно читати, виправляти та перевіряти код. Для цього Apple створила спеціальне середовище SWE-Gym з тисячами реальних завдань на Python, які містять тести для перевірки результату. У ході випробувань агенти правильно розв’язали 72,5% задач, що на 20% краще за попередні моделі. Також була створена спрощена версія SWE-Gym Lite, яка скорочує час навчання майже вдвічі, зберігаючи при цьому високу точність, що робить її зручною для швидких перевірок і тестування.