Октябрь 2025   |   Обзор события   | 6

Reddit подал иск: Perplexity AI обвиняют в краже данных для ИИ

Reddit подала иск против Perplexity AI и трех компаний, обвиняя их в нелегальном сборе данных и обходе технических защит для добычи контента. Oxylabs, AWM Proxy и SerpApi отрицают обвинения, утверждая, что занимаются сбором публичных данных и готовы защищать свою позицию в суде.

ИСХОДНЫЙ НАРРАТИВ

По данным The Register, Reddit подала иск против Perplexity AI и трех компаний, обвиняя их в нелегальном сборе данных. В качестве ответчиков указаны Oxylabs UAB, AWM Proxy и SerpApi, которых обвиняют в обходе технических защит Reddit и Google для добычи контента. Perplexity обвиняется в покупке «похищенных» данных вместо заключения лицензионных соглашений.

Уголовные аналогии и юридические аргументы

В исковом заявлении, поданном в Южном округе Нью-Йорка, Reddit сравнивает действия обвиняемых с «грабежом броневоза вместо ограбления банка». Компания утверждает, что Oxylabs, AWM Proxy и SerpApi маскируют свои IP-адреса и используют скрытые скрипты для извлечения данных из Google-поиска, обходя защиту Reddit. Юридические претензии включают нарушение Закона США о цифровых правах авторства (DMCA), недобросовестную конкуренцию и гражданское сговор.

Реакция сторон

Oxylabs назвала обвинения «непонятными», подчеркнув, что не имела прямого контакта с Reddit. Компания утверждает, что занимается «этичным сбором публичных данных» и готова защищаться в суде. SerpApi отрицает обвинения, называя их «неправдивыми», а Perplexity заявила о намерении «бороться за право свободного доступа к публичному знанию».

Контекст и параллели

Случай с Reddit — часть растущей волны судебных разбирательств вокруг использования данных для обучения ИИ. В августе Cloudflare критиковала Perplexity за игнорирование директив «no-scraping». В сентябре иски против Apple, OpenAI и Microsoft обвиняли эти компании в использовании пиратских книг, YouTube-видео и новостных материалов без лицензий.

Интересно: Каковы границы использования публичных данных для обучения ИИ, если их сбор требует обхода технических защит, а покупка такого контента без лицензий может быть признана незаконной?

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

АНАЛИТИЧЕСКИЙ РАЗБОР

Как борьба за данные меняет правила ИИ-индустрии

Юридические последствия и новые модели монетизации

Судебный иск Reddit против Perplexity AI и связанных с ней компаний выходит за рамки отдельного конфликта. Он поднимает вопрос о том, как будут регулироваться данные, собранные с публичных платформ. Если суд признает обход технических ограничений незаконным, это создаст прецедент, обязывающий ИИ-компании заключать лицензии даже на публичный контент. Это особенно важно в контексте новых переговоров Reddit с Google, где платформа рассматривает возможность динамического ценообразования на основе вклада данных в эффективность алгоритмов [!]. Такой подход может стать альтернативой «похищенному» контенту, предложив владельцу данных прямую выгоду от их использования.

Важный нюанс: легальный путь монетизации данных через лицензии и партнерства уже выглядит более устойчивым, чем нелегальный сбор. Например, Google AI Overviews активно использует данные Reddit, но при этом компания может заключать официальные соглашения, что снижает юридические риски. Для стартапов, зависящих от низкозатратных методов, это может стать барьером, но ускорит стандартизацию практик в индустрии.

Рост капитализации ИИ-стартапов и риски

Рынок ИИ-стартапов демонстрирует рекордный рост: Perplexity AI, обвиняемая в нелегальном сборе данных, за 10 месяцев увеличила оценку с $520 млн до $20 млрд, привлекая миллиардные инвестиции [!]. Такой рост связан с интеграцией компании в продукты крупных игроков, например, её поисковый двигатель внедрён в Firefox Mozilla [!]. Однако судебные разбирательства могут повлиять на доверие инвесторов. Если методы Perplexity будут признаны незаконными, это поставит под угрозу не только её позиции, но и оценки других стартапов, зависящих от аналогичных практик.

Важный нюанс: инвестиции в ИИ-стартапы часто основываются на потенциале технологий, а не на текущей юридической устойчивости. Однако рост капитализации без чёткого регулирования создаёт риск пузыря, особенно если суды начнут ужесточать правила использования данных.

Российский контекст: подготовка к новым правилам

В России аналогичные споры могут возникнуть с развитием ИИ-проектов. В стране пока отсутствует законодательная база, регулирующая сбор данных для ИИ, но международные судебные прецеденты могут влиять на будущие нормы. Например, если зарубежные суды признают обход технических ограничений незаконным, это может повлиять на оценку российских компаний, использующих публичные ресурсы без лицензий.

Важный нюанс: российским бизнесам важно заранее оценить риски своих методов сбора данных. Для проектов, ориентированных на экспорт, соблюдение международных стандартов станет обязательным. Это особенно актуально в условиях, когда крупные игроки, такие как Google или Mozilla, уже формируют новые правила игры.

Будущее ИИ: баланс между доступом и контролем

Конфликт Reddit и Perplexity AI — это не только спор о данных, а битва за контроль над будущим ИИ. Победит тот, кто сможет сочетать доступ к информации с соблюдением правил. Переговоры Reddit с Google и судебные разбирательства показывают, что рынок движется к двум моделям:

  1. Легальный путь: лицензии, динамическое ценообразование, партнёрства.
  2. Нелегальный путь: обход технических ограничений, высокие риски, но низкие затраты.

Для бизнеса ключевое — определить, какая модель устойчива в долгосрочной перспективе. В условиях роста капитализации ИИ-стартапов и ужесточения регулирования, переход на легальные методы может стать не только обязанностью, но и стратегическим преимуществом.

Коротко о главном

Почему Reddit сравнила действия ответчиков с «грабежом броневоза»?

Это сравнение подчеркивает, что компании обходят защиту Reddit вместо заключения лицензионных соглашений, что, по мнению Reddit, является недобросовестной практикой.

Какие законы нарушают Oxylabs, AWM Proxy и SerpApi по версии Reddit?

Иск указывает на нарушение Закона США о цифровых правах авторства (DMCA), недобросовестную конкуренцию и гражданский сговор из-за обхода технических ограничений.

Как ответили Oxylabs и SerpApi на обвинения?

Oxylabs назвала их «непонятными» и заявила о «этичном сборе публичных данных», а SerpApi отрицает обвинения, называя их «неправдивыми».

Почему Perplexity заявила о борьбе за «свободный доступ к публичному знанию»?

Компания позиционирует себя как сторонника использования публичных данных для ИИ, игнорируя требования Reddit и других платформ о заключении лицензионных соглашений.

Какие аналогичные иски против компаний, связанных с ИИ, были описаны в тексте?

В августе Cloudflare критиковала Perplexity за игнорирование директив «no-scraping», а в сентябре против Apple, OpenAI и Microsoft подавали иски из-за использования пиратских материалов.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность; Бизнес; Право и регулирование

Оценка значимости: 6 из 10

Судебный спор между американскими компаниями касается вопросов использования данных для ИИ, что может повлиять на глобальные ИТ-тенденции, включая Россию. Время воздействия среднесрочное, затрагиваются технологии и экономика. Последствия значимы для регулирования ИИ, но не системные.

Материалы по теме

Reddit пересматривает сделку с Google: рост доходов и ценообразование на AI-контент

Динамическое ценообразование Reddit на данные для Google иллюстрирует переход от «похищенного» контента к легальной монетизации. Это усиливает аргумент о формировании новой модели взаимодействия между контент-платформами и ИИ-компаниями, где данные становятся товаром с рыночной ценой, зависящей от их вклада в алгоритмы. Пример с Google AI Overviews подчеркивает, как крупные игроки уже внедряют такие подходы, создавая давление на стартапы.

Подробнее →
AI-стартапы выросли в $1 триллион — идут ли они в пузырь?

Резкий рост оценки Perplexity AI с $520 млн до $20 млрд за 10 месяцев служит эмпирической базой для критики «пузыря» на рынке ИИ-стартапов. Эти цифры подчеркивают парадокс: инвестиции в технологии часто игнорируют юридические риски, создавая уязвимость для всего сектора. Упоминание $200 млн инвестиций в августе 2025 года конкретизирует масштабы финансирования, усиливающие тренд.

Подробнее →
Mozilla внедряет AI-поиск в Firefox: конфиденциальность без компромиссов

Интеграция Perplexity в Firefox Mozilla демонстрирует, как стартапы могут масштабироваться через партнерства с крупными технологическими игроками. Это поддерживает тезис о том, что легальные методы (в отличие от нелегального сбора данных) позволяют не только снизить риски, но и получить системные преимущества, такие как доступ к миллионам пользователей. Упоминание «конфиденциальности без компромиссов» также отражает стратегическое позиционирование, важное для доверия инвесторов.

Подробнее →