Научное сообщество столкнулось с наводнением ИИ-статей: рост заявок в журналы до 100% и крах системы рецензирования
Научное сообщество столкнулось с наводнением убедительных, но бессмысленных статей, которые ИИ генерирует за 25 минут, перегружая и без того хрупкую систему рецензирования. Карьерная гонка за количеством публикаций превратила технологии в инструмент массового производства мусора, грозящего похоронить под тоннами фальшивых данных реальную науку.
По данным издания The Verge, в научном сообществе нарастает тревога из-за беспрецедентного наплыва статей, созданных с помощью искусственного интеллекта. Ситуация вышла за рамки простого роста публикаций: система рецензирования, и без того работающая на пределе возможностей, сталкивается с потоком работ, которые сложно отличить от качественных исследований. Эксперты фиксируют, что технологии генеративного ИИ перешли от создания откровенно ошибочных текстов к производству убедительных, стилистически выверенных материалов, что создает серьезные риски для целостности научной базы.
Масштаб проблемы и механизмы наводнения
Инцидент, ставший сигналом для сообщества, произошел в Цюрихе, где постдокторант Питер Деген заметил аномалию в цитировании одной из своих статей 2017 года. За последние месяцы документ, посвященный статистическому анализу эпидемиологических данных, стал фигурировать в сотнях новых публикаций. Исследование показало, что все эти работы следовали единому шаблону: они использовали общедоступные наборы данных, такие как исследование глобального бремени болезней, для генерации предсказаний о рисках заболеваний.
Анализ выявил, что за этим стоит не случайный интерес исследователей, а работа специализированных сервисов. На китайской платформе Bilibili обнаружены компании, предлагающие услуги по созданию научных статей за два часа с использованием программного обеспечения и ИИ-ассистентов. Эти работы не всегда содержат грубые ошибки, характерные для ранних версий нейросетей, что делает их фильтрацию крайне затруднительной. Вместо явных галлюцинаций, таких как несуществующие термины или искаженные изображения, новые статьи выглядят профессионально, но часто представляют собой бессмысленные корреляции, например, связь между потреблением орехов и когнитивными функциями или между уровнем образования и осложнениями после операций.
Мэтт Спик, доцент Университета Суррея и редактор журнала Scientific Reports, описывает этот процесс как «наводнение научным мусором». Он отмечает, что при наличии вычислительных мощностей алгоритмы могут перебирать все возможные парные ассоциации в данных и публиковать найденные совпадения, даже если они являются статистическими случайностями. Это приводит к появлению работ, которые формально верны, но лишены научной ценности.
Ситуация усугубляется появлением автономных агентов ИИ, способных не только писать текст, но и проводить анализ данных, формировать гипотезы и создавать визуализации. Тестирование инструмента Prism от компании OpenAI показало, что система за 25 минут способна создать полноценную статью с корректными ссылками и графиками на основе реальных данных. Эксперты отмечают, что качество таких работ настолько высоко, что отличить их от исследований, проведенных людьми, становится практически невозможно без детального анализа методологии.
Кризис системы рецензирования
Основное давление приходится на систему рецензирования, которая строится на добровольном труде ученых. Редакторы и рецензенты, работающие безвозмездно, сталкиваются с несоразмерным ростом объема поступающих рукописей. Журнал Security Dialogue зафиксировал рост числа заявок - 100% за год. При этом качество подаваемых работ выровнялось: исчезли явные признаки машинного происхождения, такие как оставшиеся промпты или нелепые фразы. Теперь перед редакторами стоит задача отделить полезное от бесполезного в условиях, когда оба типа работ выглядят одинаково грамотно.
Марит Мо-Прайс, главный редактор Security Dialogue, подчеркивает, что грань между мошенничеством и академической работой размывается. В одном из случаев статья прошла через десять редакторов и два раунда рецензирования, прежде чем была обнаружена фальшивая ссылка на несуществующее исследование, которое выглядело абсолютно правдоподобно. Теперь редакторы вынуждены тратить время на проверку того, действительно ли цитируемые источники являются каноническими для данной темы, что резко увеличивает нагрузку.
Ситуация с поиском рецензентов также критическая. Если раньше редактор мог получить три ответа из четырех запросов, то сейчас для получения двух рецензий требуется отправить до 20 приглашений. Ученые, перегруженные своими обязанностями, все реже соглашаются на проверку работ. Журнал Accountability in Research сообщил о росте заявок на 60%, при этом редактор Дэвид Резник отмечает, что многие из этих статей посвящены самому феномену фальсификации и написаны с использованием ИИ на основе данных из базы Retraction Watch.
Исследования показывают, что более половины исследователей уже используют ИИ для помощи в рецензировании. Однако это порождает новые риски: модели могут ссылаться на отозванные статьи как на валидные источники или писать поверхностные отзывы, упуская методологические ошибки. Кроме того, алгоритмы склонны предпочитать тексты, написанные другими ИИ, создавая замкнутый круг, где качество оценки падает.
Экономические причины и структурные изменения
Корень проблемы лежит в экономических стимулах современной академической среды. Система, где карьерный рост и финансирование зависят от количества публикаций и цитирований, создает мощный стимул для использования ИИ как инструмента для массового производства статей. Издание Nature опубликовало исследование, согласно которому ученые, внедрившие ИИ в свою работу, публикуются в три раза чаще и получают в пять раз больше цитирований, чем их коллеги, не использующие технологии. Это позволяет им быстрее становиться руководителями проектов.
Однако коллективный эффект от такого подхода негативен. Ученые начинают концентрироваться на хорошо изученных областях с обилием данных, которые легко обрабатывать алгоритмам, вместо того чтобы заниматься сложными, но важными фундаментальными вопросами. Коммерческие издательства, перешедшие на модель открытого доступа, где авторы платят за публикацию, рассматривают рост числа статей как положительную динамику доходов. В то же время университеты и грантодатели продолжают оценивать продуктивность исследователей по метрикам публикационной активности.
Эксперты указывают, что текущие меры по борьбе с фальсификацией, такие как проверка на плагиат или поиск искаженных фраз, становятся неэффективными. Joris van Rossum, директор программы Integrity Hub в организации STM, прогнозирует переход к новой парадигме, где вместо поиска подделок авторы должны будут доказывать подлинность своих данных. Это может потребовать внедрения водяных знаков на изображениях или обязательной передачи сырых данных для анализа.
Тем не менее, такие меры не решат проблему объема. Риз Ричардсон, постдокторант Северо-Западного университета, утверждает, что единственным выходом является изменение системы оценки научного вклада. Пока продуктивность измеряется количеством статей, стимулы для использования ИИ в коммерческих целях останутся. Винсент Ларивьер, главный редактор журнала Quantitative Science Studies, задает риторический вопрос: «Нам нужно больше науки, но нужно ли нам больше статей?».
Таблица ниже иллюстрирует ключевые изменения в научной среде, вызванные внедрением генеративного ИИ:
| Показатель | До массового внедрения ИИ | Текущая ситуация |
|---|---|---|
| Скорость создания статьи | Недели или месяцы работы | От 25 минут до нескольких часов |
| Качество текста | Варьируется, часто есть явные ошибки | Высокое, стилистически выверенное |
| Объем заявок в журналы | Постепенный рост | Рост на 40–100% за год |
| Эффективность поиска рецензентов | 3 ответа из 4 запросов | 2 ответа из 20 запросов |
| Типы ошибок | Галлюцинации, искаженные термины | Скрытые логические ошибки, бессмысленные корреляции |
| Основной мотив авторов | Получение новых знаний | Увеличение метрик для карьеры (CV padding) |
Ситуация требует детального анализа и пересмотра подходов к организации научной деятельности. Без изменения системы стимулов и критериев оценки риск того, что научная база будет перегружена бесполезными данными, остается высоким. Технологии, способные ускорить открытия, в текущих условиях превращаются в инструмент, угрожающий фундаментальным принципам проверки знаний.
От поиска истины к производству метрик: как ИИ меняет науку
Научное сообщество столкнулось с вызовом, который угрожает не просто качеству отдельных работ, а целостности всей системы доверия к знаниям. То, что начиналось как инструмент для ускорения рутинных задач, трансформировалось в механизм массового производства публикаций. Ситуация вышла за рамки простого роста количества статей: система рецензирования, работающая на добровольном труде, оказалась неспособна фильтровать поток материалов, которые стилистически безупречны, но лишены научной ценности.
Технологический прогресс устранил главное ограничение научного процесса — время. Если раньше на эксперимент, анализ и написание отчета уходили месяцы, то теперь автономные агенты справляются с этим за считанные минуты. Инструмент Prism от компании OpenAI, интегрирующий модель GPT-5.2 в редактор LaTeX, демонстрирует эту трансформацию на практике. Система способна за 25 минут создать полноценную статью с корректными ссылками и графиками, используя реальные данные [!]. Поскольку LaTeX является стандартом для серьезных технических и математических публикаций, угроза касается не только гуманитарных наук, но и фундаментальных исследований в точных дисциплинах.
Качество генерируемых текстов достигло нового уровня. Появление модели GPT-5.5, показавшей точность 82,7% в автономных задачах, означает, что эпоха явных «галлюцинаций» и грубых ошибок уходит в прошлое [!]. Алгоритмы научились не просто имитировать стиль ученого, но и самостоятельно проверять результаты, создавая убедительные, но ложные корреляции. Например, система может найти статистическую связь между потреблением орехов и когнитивными функциями, просто потому что эти данные часто встречаются в одних базах, хотя реальной причинно-следственной связи не существует.
Важный нюанс: Современный ИИ научился генерировать «правдоподобную ложь» — работы, которые проходят проверку на статистическую значимость, но лишены научного смысла, что делает их практически неотличимыми от реальных исследований без глубокого аудита методологии.
Экономическая логика процесса подталкивает к масштабированию. Ученые, использующие ИИ, публикуются в три раза чаще и получают в пять раз больше цитирований, чем их коллеги, работающие традиционными методами. Это создает мощный стимул для использования технологий ради улучшения резюме, а не ради получения новых открытий. Коммерческие сервисы, в том числе на платформе Bilibili, предлагают услуги по созданию научных статей за два часа. Это уже не просто помощь в написании, а полноценный черный рынок, где алгоритмы перебирают миллионы парных ассоциаций, находя случайные совпадения для публикации.
Разрыв между спросом на науку и ресурсами проверки
Система рецензирования, являющаяся фундаментом академической честности, оказалась не готова к такому темпу. Журнал Security Dialogue зафиксировал рост числа заявок на 100% за год. При этом качество подаваемых материалов выровнялось: исчезли явные признаки машинного происхождения, такие как нелепые фразы или оставшиеся промпты. Теперь перед редакторами стоит задача отделить полезное от бесполезного в условиях, когда оба типа работ выглядят одинаково грамотно.
Рецензенты сталкиваются с парадоксом: чем качественнее выглядит текст, тем сложнее найти в нем ошибку. В одном из случаев статья прошла через десять редакторов и два раунда проверки, прежде чем была выявлена фальшивая ссылка на несуществующее исследование. Алгоритм сгенерировал такую правдоподобную ссылку, что она обманула даже опытных экспертов. Теперь редакторы вынуждены тратить часы на проверку существования каждого цитируемого источника, что резко снижает пропускную способность журналов.
Ситуация усугубляется дефицитом самих рецензентов. Если раньше для получения двух отзывов требовалось отправить четыре приглашения, то теперь редакторы могут рассылать до 20 запросов, чтобы найти двух согласившихся. Ученые перегружены своими обязанностями и все реже берутся за проверку чужих работ. Более того, многие исследователи начинают использовать ИИ для написания рецензий, что создает замкнутый круг: алгоритм проверяет работу, написанную другим алгоритмом, и часто одобряет её, так как они «понимают» друг друга. Это ведет к снижению качества оценки и риску пропуска методологических ошибок.
Стоит учесть: Использование ИИ для рецензирования работ, созданных ИИ, создает эффект «эхо-камеры», где алгоритмы взаимно подтверждают друг другу некорректные выводы, что приводит к системному падению качества научной экспертизы.
Конкретный пример масштаба проблемы демонстрирует случай постдокторанта Питера Дегена. Он заметил аномалию в цитировании своей статьи 2017 года: документ, посвященный статистическому анализу эпидемиологических данных, стал фигурировать в сотнях новых публикаций. Анализ показал, что все эти работы следовали единому шаблону и использовали общедоступные наборы данных для генерации предсказаний. Это не случайный интерес исследователей, а результат работы специализированных сервисов, которые «раздувают» цитируемость старых работ, создавая иллюзию бурной научной активности.
Экономические стимулы и структурный тупик
Корень проблемы лежит в системе мотивации. Карьерный рост и финансирование в современной академической среде напрямую зависят от количества публикаций и цитирований. Исследование, опубликованное в Nature, показало, что ученые, использующие ИИ, публикуются в три раза чаще и получают в пять раз больше цитирований. Это создает мощный стимул для массового производства статей ради улучшения резюме, а не ради получения новых знаний.
Коммерческие издательства, работающие по модели открытого доступа, где авторы платят за публикацию, также заинтересованы в росте количества статей, так как это увеличивает их доходы. В то же время университеты и грантодатели продолжают оценивать продуктивность исследователей по старым метрикам. Пока система поощряет количество, а не качество, использование ИИ для «накрутки» показателей будет только расти.
Экономическая модель внедрения новых технологий также меняется. Удвоение цен на токены при использовании продвинутых моделей, таких как GPT-5.5, оправдано лишь при условии сокращения итераций [!]. Это делает экономически выгодным генерацию большого объема «мусорных» статей с минимальными правками, так как стоимость ошибки снижается, а скорость производства растет.
Для российской науки этот тренд несет конкретные риски. Если мировая наука переходит на модель, где ценность определяется не количеством публикаций, а их проверяемостью, то российские исследователи и вузы, ориентированные на метрики публикационной активности (RSC, Scopus), рискуют столкнуться с обесцениванием своих достижений. Мировые базы данных могут начать массово отзывать статьи или помечать их как сгенерированные, что ударит по репутации научных центров.
Эксперты отмечают, что текущие методы борьбы с фальсификацией, такие как поиск плагиата или анализ стиля, становятся неэффективными. Единственным выходом видится смена парадигмы: вместо поиска подделок авторы должны будут доказывать подлинность своих данных. Это может потребовать обязательной передачи сырых данных, внедрения цифровых водяных знаков на изображениях и пересмотра критериев оценки научного вклада.
Однако даже эти меры не решат проблему объема. Пока продуктивность измеряется количеством статей, стимулы для использования ИИ в коммерческих целях останутся. Вопрос, который задает главный редактор журнала Quantitative Science Studies, звучит фундаментально: «Нам нужно больше науки, но нужно ли нам больше статей?». Ответ на него определит будущее научного сообщества на десятилетия вперед.
Для российского бизнеса и науки это означает необходимость пересмотра подходов к оценке эффективности исследований. Ориентация на внешние метрики, которые легко подделать с помощью ИИ, становится рискованной стратегией. Приоритетом должно стать создание механизмов верификации данных и фокус на реальных инновациях, а не на количестве публикаций. Иначе научная база рискует превратиться в хаотичный набор бессмысленных корреляций, который невозможно использовать для принятия решений.
Технологии, способные ускорить открытия, в текущих условиях превращаются в инструмент, угрожающий фундаментальным принципам проверки знаний. Без изменения системы стимулов и критериев оценки риск того, что научная база будет перегружена бесполезными данными, остается высоким.
Источник: The Verge