Reddit подал иск: Perplexity AI обвиняют в краже данных для ИИ
Reddit подала иск против Perplexity AI и трех компаний, обвиняя их в нелегальном сборе данных и обходе технических защит для добычи контента. Oxylabs, AWM Proxy и SerpApi отрицают обвинения, утверждая, что занимаются сбором публичных данных и готовы защищать свою позицию в суде.
По данным The Register, Reddit подала иск против Perplexity AI и трех компаний, обвиняя их в нелегальном сборе данных. В качестве ответчиков указаны Oxylabs UAB, AWM Proxy и SerpApi, которых обвиняют в обходе технических защит Reddit и Google для добычи контента. Perplexity обвиняется в покупке «похищенных» данных вместо заключения лицензионных соглашений.
Уголовные аналогии и юридические аргументы
В исковом заявлении, поданном в Южном округе Нью-Йорка, Reddit сравнивает действия обвиняемых с «грабежом броневоза вместо ограбления банка». Компания утверждает, что Oxylabs, AWM Proxy и SerpApi маскируют свои IP-адреса и используют скрытые скрипты для извлечения данных из Google-поиска, обходя защиту Reddit. Юридические претензии включают нарушение Закона США о цифровых правах авторства (DMCA), недобросовестную конкуренцию и гражданское сговор.
Реакция сторон
Oxylabs назвала обвинения «непонятными», подчеркнув, что не имела прямого контакта с Reddit. Компания утверждает, что занимается «этичным сбором публичных данных» и готова защищаться в суде. SerpApi отрицает обвинения, называя их «неправдивыми», а Perplexity заявила о намерении «бороться за право свободного доступа к публичному знанию».
Контекст и параллели
Случай с Reddit — часть растущей волны судебных разбирательств вокруг использования данных для обучения ИИ. В августе Cloudflare критиковала Perplexity за игнорирование директив «no-scraping». В сентябре иски против Apple, OpenAI и Microsoft обвиняли эти компании в использовании пиратских книг, YouTube-видео и новостных материалов без лицензий.
Интересно: Каковы границы использования публичных данных для обучения ИИ, если их сбор требует обхода технических защит, а покупка такого контента без лицензий может быть признана незаконной?

Как борьба за данные меняет правила ИИ-индустрии
Юридические последствия и новые модели монетизации
Судебный иск Reddit против Perplexity AI и связанных с ней компаний выходит за рамки отдельного конфликта. Он поднимает вопрос о том, как будут регулироваться данные, собранные с публичных платформ. Если суд признает обход технических ограничений незаконным, это создаст прецедент, обязывающий ИИ-компании заключать лицензии даже на публичный контент. Это особенно важно в контексте новых переговоров Reddit с Google, где платформа рассматривает возможность динамического ценообразования на основе вклада данных в эффективность алгоритмов [!]. Такой подход может стать альтернативой «похищенному» контенту, предложив владельцу данных прямую выгоду от их использования.
Важный нюанс: легальный путь монетизации данных через лицензии и партнерства уже выглядит более устойчивым, чем нелегальный сбор. Например, Google AI Overviews активно использует данные Reddit, но при этом компания может заключать официальные соглашения, что снижает юридические риски. Для стартапов, зависящих от низкозатратных методов, это может стать барьером, но ускорит стандартизацию практик в индустрии.
Рост капитализации ИИ-стартапов и риски
Рынок ИИ-стартапов демонстрирует рекордный рост: Perplexity AI, обвиняемая в нелегальном сборе данных, за 10 месяцев увеличила оценку с $520 млн до $20 млрд, привлекая миллиардные инвестиции [!]. Такой рост связан с интеграцией компании в продукты крупных игроков, например, её поисковый двигатель внедрён в Firefox Mozilla [!]. Однако судебные разбирательства могут повлиять на доверие инвесторов. Если методы Perplexity будут признаны незаконными, это поставит под угрозу не только её позиции, но и оценки других стартапов, зависящих от аналогичных практик.
Важный нюанс: инвестиции в ИИ-стартапы часто основываются на потенциале технологий, а не на текущей юридической устойчивости. Однако рост капитализации без чёткого регулирования создаёт риск пузыря, особенно если суды начнут ужесточать правила использования данных.
Российский контекст: подготовка к новым правилам
В России аналогичные споры могут возникнуть с развитием ИИ-проектов. В стране пока отсутствует законодательная база, регулирующая сбор данных для ИИ, но международные судебные прецеденты могут влиять на будущие нормы. Например, если зарубежные суды признают обход технических ограничений незаконным, это может повлиять на оценку российских компаний, использующих публичные ресурсы без лицензий.
Важный нюанс: российским бизнесам важно заранее оценить риски своих методов сбора данных. Для проектов, ориентированных на экспорт, соблюдение международных стандартов станет обязательным. Это особенно актуально в условиях, когда крупные игроки, такие как Google или Mozilla, уже формируют новые правила игры.
Будущее ИИ: баланс между доступом и контролем
Конфликт Reddit и Perplexity AI — это не только спор о данных, а битва за контроль над будущим ИИ. Победит тот, кто сможет сочетать доступ к информации с соблюдением правил. Переговоры Reddit с Google и судебные разбирательства показывают, что рынок движется к двум моделям:
- Легальный путь: лицензии, динамическое ценообразование, партнёрства.
- Нелегальный путь: обход технических ограничений, высокие риски, но низкие затраты.
Для бизнеса ключевое — определить, какая модель устойчива в долгосрочной перспективе. В условиях роста капитализации ИИ-стартапов и ужесточения регулирования, переход на легальные методы может стать не только обязанностью, но и стратегическим преимуществом.