Декабрь 2025   |   Обзор события   | 6

Google подала иск против SerpApi за обход защиты и скрейпинг данных

Google подала иск против SerpApi, обвиняя компанию в обходе защитных механизмов поисковой системы и использовании автоматизированных методов для извлечения результатов поиска. В рамках дела компания требует прекратить такие действия и уничтожить технологии, применяемые для сбора данных.

ИСХОДНЫЙ НАРРАТИВ

По данным The Verge, Google подала иск против компании SerpApi, которая предоставляет инструменты для сбора данных с веб-сайтов, включая результаты поиска Google. В рамках дела компания обвиняет SerpApi в нарушении авторского права, а именно — в использовании обманных методов для автоматического доступа к результатам поиска и последующей продажи этих данных.

Обвинения в обходе защитных механизмов

В иске говорится, что SerpApi нашла способ обойти SearchGuard — технологию, разработанную Google в начале 2025 года для предотвращения скрейпинга результатов поиска. После запуска этой меры SerpApi была блокирована, но компания сразу начала разработку методов, позволяющих обходить защиту. В итоге, SerpApi продолжила сбор данных, маскируя автоматические запросы под действия обычных пользователей.

Одним из способов, описанных в иске, стало создание «фейковых браузеров» с использованием множества IP-адресов, чтобы запросы выглядели как от реальных пользователей. Таким образом, SerpApi продолжает извлекать данные в масштабах, описанных как «впечатляющие».

Заявлены нарушения прав на контент

Google указывает, что результаты поиска содержат значительный объем защищенного авторским правом контента — включая изображения, отображаемые в модулях, таких как Knowledge Panel. По мнению компании, действия SerpApi подрывают инвестиции Google в лицензирование этого контента, предоставляя его сторонним сервисам, которые не несут аналогичных затрат.

Предъявлены юридические требования

В рамках судебного разбирательства Google просит суд обязать SerpApi прекратить обход технических ограничений и уничтожить все технологии, используемые для сбора данных. Компания также требует, чтобы SerpApi больше не распространяла контент, извлечённый с нарушением прав.

Связь с предыдущими исками

Ранее в этом году Reddit также подала иск против SerpApi и двух других компаний, занимающихся сбором данных. В иске отмечалось, что одна из этих компаний извлекала контент с сайта Reddit, который, как утверждается, использовался для обучения ИИ-стартапа Perplexity. Впрочем, в иске Google упоминается только факт судебных действий Reddit, но не конкретизируются детали использования контента для ИИ.

Интересно: Каким образом компании, занимающиеся сбором данных, смогут адаптироваться к усиливающимся техническим и юридическим барьерам, не нарушая права владельцев контента?

Концептуальное изображение
Создано специально для ASECTOR
Концептуальное изображение

АНАЛИТИЧЕСКИЙ РАЗБОР

Когда борьба за данные становится битвой за контроль

Война за доступ к информации

Компании, которые занимаются сбором данных с веб-сайтов, находятся в центре внимания крупных технологических гигантов. Google, подавая иск против SerpApi, не только защищает свои результаты поиска — она демонстрирует, как растёт борьба за контроль над цифровой экосистемой. В центре этой борьбы — не только вопросы авторского права, но и баланс сил между централизованными платформами и сторонними поставщиками данных.

Важный нюанс: SerpApi и подобные сервисы позволяют другим компаниям обходить барьеры, созданные Google, чтобы защитить свою собственную экосистему. Это подрывает не только доходы от рекламы, но и всю структуру, на которой построено цифровое доминирование Google. Особенно это становится очевидным, если учесть, что Cloudflare зафиксировала более 416 миллиардов запросов от ИИ-ботов Google, блокируя их для защиты контента клиентов [!].

Как работает «обход» защитных механизмов

SerpApi, согласно иску, нашла способ обойти SearchGuard — защитную систему, которая, как ожидается, должна была остановить скрейпинг. Однако, вместо этого, компания создала «фейковые браузеры» и использовала множество IP-адресов, чтобы запросы выглядели как действия реальных пользователей. Это позволяет SerpApi извлекать данные в масштабах, которые Google описывает как «впечатляющие».

Важный нюанс: Такой подход демонстрирует, насколько сложно становится контролировать доступ к данным в условиях, когда сторонние компании готовы вкладывать ресурсы в создание сложных технических решений, чтобы обойти защиту. Это создаёт новую угрозу для бизнес-моделей, основанных на монопольном контроле над данными. Особенно это актуально в контексте Европейской комиссии, которая уже начала расследование, связанное с использованием контента Google для ИИ-продуктов [!].

Что происходит с контентом, который «забирают»

Google подчёркивает, что результаты поиска содержат защищённый контент — включая изображения из Knowledge Panel. Эти элементы — не только результаты, а интегрированные элементы, лицензированные Google. По мнению компании, SerpApi не только нарушает права на этот контент, но и позволяет другим компаниям использовать его без аналогичных затрат на лицензирование.

Ключевой момент: Здесь возникает парадокс: если данные становятся общей собственностью, то теряется вся логика инвестиций в их создание. Это может привести к тому, что компании перестанут вкладывать средства в качественный контент, опасаясь, что он будет использован без компенсации. Примером такого рода споров стал иск, поданный The New York Times против Perplexity, которая обвинялась в использовании контента без разрешения [!].

Важный нюанс: Борьба Google с SerpApi — это не только юридический спор. Это попытка установить новый стандарт, где контроль над данными становится важнее, чем их доступность. Если Google победит, это закрепит за крупными платформами монопольное право на информацию.

Связь с предыдущими исками и трендом

Это не первый подобный иск. В этом же году Reddit подала иск против SerpApi и других компаний за сбор данных с их сайта. Подобные действия указывают на то, что крупные платформы начинают активно защищать свои данные, особенно в условиях роста интереса к ИИ, где данные — это топливо. SerpApi включена в список ответчиков в иске Reddit, которая обвиняет её в обходе технических защит платформы и Google для нелегального сбора контента [!].

Ключевой момент: В будущем, когда ИИ будет всё больше зависеть от доступа к данным, такие иски могут стать частью новой нормы. Это может привести к тому, что независимые разработчики ИИ столкнутся с серьёзными ограничениями, если не смогут договориться с владельцами данных напрямую. Примером такого подхода может служить соглашение между Reddit и Google, где рассматривается возможность динамического ценообразования на основе вклада контента в эффективность алгоритмов [!].

Важный нюанс: Если компании, занимающиеся сбором данных, не найдут легальных путей для адаптации, они могут потерять не только доступ к данным, но и доверие рынка. Это может привести к тому, что бизнесы, зависящие от стороннего контента, будут вынуждены перестраиваться или исчезнут вовсе.

Долгосрочные последствия для бизнеса

В условиях роста юридической активности со стороны крупных платформ, российский бизнес должен учитывать следующие тенденции:

  • Рост стоимости доступа к данным. С увеличением спроса на лицензированный контент, стоимость его использования будет расти. Это особенно касается ИИ-проектов, где данные — ключевой ресурс.
  • Необходимость аудита. Для минимизации рисков ключевым становится аудит собственных процессов сбора данных, чтобы исключить нарушения авторских прав.
  • Развитие альтернативных источников. Компании, зависящие от стороннего контента, должны искать пути к разработке собственных баз данных или сотрудничеству с владельцами контента на законных основаниях.

Эксперты отмечают, что юридические риски для компаний, использующих ИИ без лицензий, растут. Примером может служить иск Warner Bros. против Midjourney, где компания обвиняется в генерации изображений с известными персонажами без разрешений [!]. Такие дела формируют правовую базу, которая может ограничить свободу действий ИИ-компаний в будущем.

Важный нюанс: В условиях усиления регулирования, бизнесу важно не только соблюдать закон, но и строить долгосрочные отношения с владельцами контента. Это может стать конкурентным преимуществом в отрасли, где данные становятся стратегическим ресурсом.

Коротко о главном

Как SerpApi обходила защиту Google SearchGuard?

После блокировки SerpApi разработала методы, позволяющие обходить защиту, включая создание «фейковых браузеров» и использование множества IP-адресов, чтобы запросы выглядели как от реальных пользователей.

Какой объем данных извлекала SerpApi?

В иске упоминается, что SerpApi извлекала данные в масштабах, описанных как «впечатляющие», что указывает на широкомасштабный сбор информации.

Какие требования предъявила Google в суде?

Google просит обязать SerpApi прекратить обход технических ограничений, уничтожить технологии для сбора данных и прекратить распространение извлеченного контента.

Почему Google называет действия SerpApi ущербными?

Google утверждает, что действия SerpApi подрывают инвестиции компании в лицензирование контента, включая изображения в модулях, таких как Knowledge Panel.

Есть ли связь между иском Google и другими судебными делами?

Ранее Reddit подала иск против SerpApi и двух других компаний, также обвиняя их в нелегальном сборе данных, что указывает на систематические нарушения со стороны SerpApi.

Инфографика событий

Открыть инфографику на весь экран


Участники и связи

Отрасли: ИТ и программное обеспечение; Искусственный интеллект (AI); Кибербезопасность; Бизнес; Цифровизация и технологии

Оценка значимости: 6 из 10

Событие касается региональной аудитории, поскольку затрагивает технологии и бизнес-модели, но не имеет прямого влияния на российских пользователей или экономику. Оно краткосрочного характера, сосредоточено в узкой сфере цифровых технологий и авторского права. Поскольку речь идёт о конфликте между иностранными компаниями, влияние на Россию минимально, хотя тема защиты данных и ИИ может быть актуальной в долгосрочной перспективе.

Материалы по теме

Cloudflare заблокировала 416 млрд запросов ИИ-ботов Google

Упоминание 416 миллиардов заблокированных запросов от ИИ-ботов Google Cloudflare подчеркивает масштабную борьбу за контроль над данными и демонстрирует, как крупные платформы используют ИИ для доминирования в интернет-экосистеме. Это усиливает аргумент о том, что Google стремится создать неравные условия для остальных участников рынка.

Подробнее →
Еврокомиссия расследует Google из-за использования контента для ИИ

Расследование Европейской комиссии по поводу использования Google контента для ИИ без компенсации поддерживает идею о нарушении антимонопольных правил и усиливает дискуссию о необходимости регулирования ИИ-ботов. Оно служит примером международного давления на крупные технологические компании.

Подробнее →
СМИ и ИИ-стартапы вступили в новый этап войны за контент

Иск The New York Times против Perplexity иллюстрирует рост юридических рисков для ИИ-компаний, использующих контент без разрешения. Он подкрепляет тезис о том, что СМИ всё чаще требуют компенсации за нелицензированное применение своих материалов в обучении ИИ.

Подробнее →
Reddit подал иск: Perplexity AI обвиняют в краже данных для ИИ

Иск Reddit против SerpApi и других компаний, обвиняющих их в обходе защит, служит доказательством того, что крупные платформы начали активно защищать свои данные. Это поддерживает аргумент о том, что сбор данных без разрешения становится частью новой нормы в борьбе за цифровой контроль.

Подробнее →
Reddit пересматривает сделку с Google: рост доходов и ценообразование на AI-контент

Переговоры Reddit с Google о динамическом ценообразовании за данные подчеркивают рост ценности контента в ИИ-экосистеме и демонстрируют, как платформы могут начать взимать плату за использование своих данных. Это поддерживает мысль о том, что бизнесу нужно искать легальные пути доступа к контенту.

Подробнее →
Warner Bros. подал иск против Midjourney за генерацию персонажей

Иск Warner Bros. против Midjourney показывает, что юридические риски для компаний, использующих ИИ без лицензий, растут. Он усиливает тезис о том, что правовые рамки для ИИ становятся жёстче, и бизнесу важно соблюдать авторские права.

Подробнее →