Декабрь 2025   |   Обзор события   | 6

ИИ-код содержит больше ошибок и уязвимостей, чем человеческий — в 1,7 раза

Искусственный интеллект, используемый для написания кода, в среднем создаёт больше ошибок по сравнению с человеческим кодом, включая проблемы с логикой, безопасностью и производительностью. Анализ показывает, что такие ошибки требуют дополнительной проверки и повышают риски в готовом продукте.

ИСХОДНЫЙ НАРРАТИВ

По данным The Register, исследование, проведённое платформой CodeRabbit, выявило, что использование ИИ для написания кода увеличивало как количество, так и серьёзность ошибок, требующих проверки. Результаты анализа 470 открытых pull - запросов, опубликованные в отчёте «State of AI vs Human Code Generation», показывают, что код, сгенерированный с помощью искусственного интеллекта, содержит больше дефектов в области логики, поддерживаемости, безопасности и производительности по сравнению с кодом, написанным людьми.

Количество проблем

В среднем, pull - запросы, созданные с участием ИИ, содержат 10,83 ошибки, тогда как у человеческих — 6,45. Это означает, что объём ошибок в случае с ИИ возрастает примерно в 1,7 раза. В свою очередь, критические и значительные ошибки также встречаются чаще: 1,4 и 1,7 раза соответственно. Такие показатели требуют большего времени на проверку и повышают риски возникновения дефектов в готовом продукте.

Категории ошибок

Код, сгенерированный ИИ, уступает человеческому по всем ключевым категориям:

  • Логика и корректность - ошибки в 1,75 раза чаще;
  • Проблемы с поддерживаемостью и качеством кода — 1,64 раза;
  • Найденные уязвимости в безопасности — 1,57 раза;
  • Вопросы производительности — 1,42 раза.

В плане конкретных угроз, ИИ-код чаще содержит:

  • Неправильную обработку паролей — 1,88 раза;
  • Небезопасные ссылки на объекты — 1,91 раза;
  • Уязвимости XSS — 2,74 раза;
  • Небезопасную сериализацию — 1,82 раза.

Однако, в одном аспекте ИИ превосходит человека — орфографические ошибки в комментариях к коду встречаются в 1,76 раза реже. Также, по сравнению с человеческим кодом, ИИ-код содержит на 32% меньше проблем, связанных с тестированием.

Другие исследования

Другие работы, основанные на иных данных, пришли к различным выводам. Например, исследование, опубликованное в августе 2025 годом учёными из Неаполитанского университета, показало, что ИИ-код, как правило, проще и повторяется чаще, но при этом содержит больше неиспользуемых конструкций и жёстко заданных отладочных фрагментов. У человеческого кода, напротив, структура сложнее, а проблем с поддерживаемостью — больше.

В январе 2025 года исследователи из Монашского университета (Австралия) и Венгерского университета Отаго (Новая Зеландия) опубликовали работу, в которой отмечали, что GPT-4 способен создавать рабочие решения, но они часто требуют доработки. При этом, по их данным, код, сгенерированный GPT-4, проходит больше тестовых случаев, чем человеческий.

Производительность и безопасность

Исследование, проведённое в июле группой Model Evaluation & Threat Research (METR), показало, что инструменты ИИ могут снижать продуктивность разработчиков. В свою очередь, Microsoft заявила, что в определённых репозиториях 30% кода написан с помощью ИИ, а сопровождение инструмента Copilot Actions сопряжено с определёнными рисками безопасности.

Ключевой вызов: Как обеспечить высокий уровень качества и безопасности при использовании ИИ для автоматизации разработки, учитывая, что сгенерированный код требует более тщательной проверки и может содержать значительные уязвимости?

АНАЛИТИЧЕСКИЙ РАЗБОР

Когда ИИ пишет код — кто проверяет ИИ?

Использование искусственного интеллекта в разработке программного обеспечения давно вышло за рамки экспериментов. Сегодня ИИ-ассистенты вроде GitHub Copilot или CodeRabbit становятся частью повседневной работы программистов. Но чем больше кода генерируется ИИ, тем больше возникает вопросов: действительно ли он лучше, быстрее и безопаснее, чем человеческий?

Почему ИИ-код требует больше проверки

Анализ 470 pull-запросов, проведённый CodeRabbit, показывает, что сгенерированный ИИ код содержит в среднем на 70% больше ошибок, чем написанный вручную. Особенно критично, что ИИ чаще допускает логические ошибки, уязвимости безопасности и проблемы с производительностью. Например, уязвимости XSS — типичная проблема в веб-разработке — встречаются в сгенерированном коде в 2,74 раза чаще. Это не просто статистика: это означает, что каждый разработчик, внедряющий ИИ-код, сталкивается с необходимостью более тщательной проверки [!].

Ключевой момент: ИИ не просто заменяет программиста — он меняет характер его работы. Вместо написания кода, разработчик превращается в проверяющего, и его задача становится сложнее, а не проще.

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

Кто выигрывает, а кто теряет

На первый взгляд, ИИ обещает экономию времени и снижение затрат. Но если код требует больше ручной проверки, то выгода может быть иллюзорной. Особенно это касается компаний, где разработка ПО — это не единичный проект, а часть масштабной экосистемы. В таких условиях ИИ может создать иллюзию прогресса, но на деле увеличить долгосрочные издержки.

С другой стороны, ИИ-ассистенты могут быть полезны в образовательных целях, для быстрого прототипирования и в мелких проектах, где качество кода не критично. Однако в критически важных системах — от банковских приложений до транспортных систем — использовать ИИ без глубокой проверки — это риск, который может обернуться реальными последствиями.

Важный нюанс: ИИ не устраняет ошибки — он меняет их тип. Вместо грамматических и стилистических ошибок, которые человек легко замечает, ИИ производит ошибки в логике и безопасности, которые гораздо сложнее выявить.

Как это влияет на российский рынок

Для российских компаний, которые активно внедряют ИИ в разработку ПО, особенно важно учитывать этот сдвиг. С одной стороны, ИИ позволяет ускорить разработку и снизить порог входа в рынок для новых игроков. С другой — он требует новых подходов к тестированию, аудиту и обучению персонала. Это может стать дополнительной нагрузкой на уже перегруженные ресурсы.

В долгосрочной перспективе, компании, которые не будут учитывать эти особенности, рискуют столкнуться с ростом технической задолженности, увеличением времени на сопровождение и снижением общей надёжности продуктов. Это особенно актуально для отраслей, где безопасность и устойчивость — ключевые факторы.

Важный нюанс: Внедрение ИИ в разработку ПО не снижает требования к качеству — оно их меняет. И если не пересмотреть процессы контроля, риски могут превзойти выгоды.

Новые вызовы: инфраструктура и безопасность

Однако ИИ не только влияет на качество кода — он становится центральным элементом в архитектуре современных систем. Рост спроса на ИИ-инфраструктуру уже привёл к дефициту оперативной памяти DRAM, что вызвало резкий рост цен на рынке. Производители, такие как G. SKILL и Micron, констатируют нестабильность поставок, а цены на комплекты памяти выросли более чем в три раза [!].

В этой же сфере SK hynix и NVIDIA разрабатывают SSD нового поколения, оптимизированный под задачи инференса искусственного интеллекта. Устройство, получившее внутреннее название Storage Next, должно обеспечить рекордную производительность и стать промежуточным слоем между памятью и накопителями, чтобы справляться с масштабами данных современных ИИ-моделей [!].

Такие изменения в инфраструктуре подчёркивают, что ИИ — это не только вопрос алгоритмов, но и масштабной перестройки всей технической экосистемы. Это особенно важно для компаний, которые планируют развивать собственные ИИ-продукты или внедрять их в существующие решения.

Долгосрочные стратегии для российского бизнеса

Для российских компаний, которые хотят эффективно использовать ИИ, важно учитывать не только текущие риски, но и долгосрочные тенденции. Среди них:

  • Усиление процессов проверки и тестирования. В условиях увеличения количества ошибок в сгенерированном коде, автоматизированные и ручные проверки становятся неотъемлемой частью процесса.
  • Обновление навыков персонала. Разработчики должны быть обучены не только писать код, но и анализировать, тестировать и аудировать ИИ-решения.
  • Интеграция ИИ в существующие процессы. Внедрение ИИ не должно происходить вне контекста текущих бизнес-процессов. Его нужно интегрировать в уже сложившиеся практики, чтобы не создавать дополнительной нагрузки.
  • Контроль над инфраструктурой. Рост цен на компоненты ИИ-инфраструктуры требует пересмотра стратегий закупок и распределения ресурсов. Компаниям нужно учитывать не только стоимость разработки, но и стоимость эксплуатации.
  • Снижение зависимости от внешних поставщиков. Учитывая риски, связанные с глобальными колебаниями рынка, важно развивать внутренние ИИ-инициативы и создавать собственные решения, где это возможно.

Эти шаги помогут не только минимизировать риски, но и использовать потенциал ИИ для устойчивого роста и инноваций.

Коротко о главном

На сколько больше ошибок встречается в коде, сгенерированном ИИ, по сравнению с человеческим?

Pull - запросы с участием ИИ в среднем содержат 10,83 ошибки, в то время как у человеческого кода — 6,45, что в 1,7 раза выше, что приводит к увеличению времени на проверку и риску дефектов в продукте.

Какие категории ошибок чаще встречаются в коде, созданном ИИ?

ИИ-код уступает человеческому по всем ключевым категориям: логические ошибки — в 1,75 раза чаще, проблемы с поддерживаемостью — в 1,64 раза, уязвимости безопасности — в 1,57 раза.

Какие конкретные уязвимости чаще встречаются в ИИ-коде?

Наиболее частыми являются небезопасные ссылки на объекты (в 1,91 раза чаще), уязвимости XSS (в 2,74 раза) и неправильная обработка паролей (в 1,88 раза), что увеличивает риски безопасности.

В чём ИИ-код превосходит человеческий?

В комментариях к ИИ-коду орфографических ошибок в 1,76 раза меньше, а проблем, связанных с тестированием, на 32% меньше, что снижает нагрузку на тестировщиков.

Какие выводы показали другие исследования по теме?

Работа учёных из Наполитанского университета показала, что ИИ-код проще и повторяется чаще, но содержит больше неиспользуемых конструкций, в то время как человеческий код сложнее и имеет больше проблем с поддержкой.

Как Microsoft оценивает использование ИИ в разработке?

Компания заявила, что в определённых репозиториях 30% кода написано с помощью ИИ, а использование инструментов вроде Copilot Actions связано с рисками безопасности, что требует дополнительных мер контроля.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность

Оценка значимости: 6 из 10

Событие касается роста использования ИИ в программировании и связано с выявлением проблем в сгенерированном коде. Хотя оно не является прямым событием в России, тема ИИ и его применение в разработке программного обеспечения имеет нарастающий интерес в российских технологических кругах. Масштаб аудитории региональный, так как затрагивает профессиональную среду разработчиков, но не весь социум. Воздействие среднесрочное, затрагивает несколько сфер — технологию, безопасность и экономику. Последствия заметны, но не системные, что соответствует среднему уровню значимости для российской аудитории.

Материалы по теме

Дефицит DRAM: цены взлетают из-за спроса ИИ-индустрии

Рост цен на DRAM более чем в три раза из-за спроса ИИ-индустрии подчеркивает масштаб инфраструктурных изменений, вызванных внедрением искусственного интеллекта. Эти данные усиливают аргумент о том, что ИИ требует не только алгоритмических решений, но и значительной перестройки технической базы, включая увеличение затрат на компоненты памяти.

Подробнее →
SK hynix и NVIDIA создают AI SSD для роста инференса в ИИ

Создание SSD нового поколения Storage Next, разрабатываемого SK hynix и NVIDIA, демонстрирует необходимость специализированных решений для обработки больших объёмов данных ИИ. Эти данные подкрепляют тезис о том, что ИИ не только меняет характер разработки, но и требует новых подходов к хранению и обработке информации, что влияет на всю техническую экосистему.

Подробнее →
Google разработал тест для проверки точности ИИ-ассистентов — результаты удивили

Результаты теста FACTS Benchmark Suite показывают, что даже лучшие ИИ-модели не превышают 70% точности ответов. Это усиливает аргумент о том, что ИИ-ассистенты требуют тщательной проверки, особенно в ответственных сферах. Данные из блока подчёркивают необходимость участия человека в процессе контроля и повышают осознание рисков автоматизации.

Подробнее →