Google подала иск против SerpApi за обход защиты и скрейпинг данных
Google подала иск против SerpApi, обвиняя компанию в обходе защитных механизмов поисковой системы и использовании автоматизированных методов для извлечения результатов поиска. В рамках дела компания требует прекратить такие действия и уничтожить технологии, применяемые для сбора данных.
По данным The Verge, Google подала иск против компании SerpApi, которая предоставляет инструменты для сбора данных с веб-сайтов, включая результаты поиска Google. В рамках дела компания обвиняет SerpApi в нарушении авторского права, а именно — в использовании обманных методов для автоматического доступа к результатам поиска и последующей продажи этих данных.
Обвинения в обходе защитных механизмов
В иске говорится, что SerpApi нашла способ обойти SearchGuard — технологию, разработанную Google в начале 2025 года для предотвращения скрейпинга результатов поиска. После запуска этой меры SerpApi была блокирована, но компания сразу начала разработку методов, позволяющих обходить защиту. В итоге, SerpApi продолжила сбор данных, маскируя автоматические запросы под действия обычных пользователей.
Одним из способов, описанных в иске, стало создание «фейковых браузеров» с использованием множества IP-адресов, чтобы запросы выглядели как от реальных пользователей. Таким образом, SerpApi продолжает извлекать данные в масштабах, описанных как «впечатляющие».
Заявлены нарушения прав на контент
Google указывает, что результаты поиска содержат значительный объем защищенного авторским правом контента — включая изображения, отображаемые в модулях, таких как Knowledge Panel. По мнению компании, действия SerpApi подрывают инвестиции Google в лицензирование этого контента, предоставляя его сторонним сервисам, которые не несут аналогичных затрат.
Предъявлены юридические требования
В рамках судебного разбирательства Google просит суд обязать SerpApi прекратить обход технических ограничений и уничтожить все технологии, используемые для сбора данных. Компания также требует, чтобы SerpApi больше не распространяла контент, извлечённый с нарушением прав.
Связь с предыдущими исками
Ранее в этом году Reddit также подала иск против SerpApi и двух других компаний, занимающихся сбором данных. В иске отмечалось, что одна из этих компаний извлекала контент с сайта Reddit, который, как утверждается, использовался для обучения ИИ-стартапа Perplexity. Впрочем, в иске Google упоминается только факт судебных действий Reddit, но не конкретизируются детали использования контента для ИИ.
Интересно: Каким образом компании, занимающиеся сбором данных, смогут адаптироваться к усиливающимся техническим и юридическим барьерам, не нарушая права владельцев контента?

Когда борьба за данные становится битвой за контроль
Война за доступ к информации
Компании, которые занимаются сбором данных с веб-сайтов, находятся в центре внимания крупных технологических гигантов. Google, подавая иск против SerpApi, не только защищает свои результаты поиска — она демонстрирует, как растёт борьба за контроль над цифровой экосистемой. В центре этой борьбы — не только вопросы авторского права, но и баланс сил между централизованными платформами и сторонними поставщиками данных.
Важный нюанс: SerpApi и подобные сервисы позволяют другим компаниям обходить барьеры, созданные Google, чтобы защитить свою собственную экосистему. Это подрывает не только доходы от рекламы, но и всю структуру, на которой построено цифровое доминирование Google. Особенно это становится очевидным, если учесть, что Cloudflare зафиксировала более 416 миллиардов запросов от ИИ-ботов Google, блокируя их для защиты контента клиентов [!].
Как работает «обход» защитных механизмов
SerpApi, согласно иску, нашла способ обойти SearchGuard — защитную систему, которая, как ожидается, должна была остановить скрейпинг. Однако, вместо этого, компания создала «фейковые браузеры» и использовала множество IP-адресов, чтобы запросы выглядели как действия реальных пользователей. Это позволяет SerpApi извлекать данные в масштабах, которые Google описывает как «впечатляющие».
Важный нюанс: Такой подход демонстрирует, насколько сложно становится контролировать доступ к данным в условиях, когда сторонние компании готовы вкладывать ресурсы в создание сложных технических решений, чтобы обойти защиту. Это создаёт новую угрозу для бизнес-моделей, основанных на монопольном контроле над данными. Особенно это актуально в контексте Европейской комиссии, которая уже начала расследование, связанное с использованием контента Google для ИИ-продуктов [!].
Что происходит с контентом, который «забирают»
Google подчёркивает, что результаты поиска содержат защищённый контент — включая изображения из Knowledge Panel. Эти элементы — не только результаты, а интегрированные элементы, лицензированные Google. По мнению компании, SerpApi не только нарушает права на этот контент, но и позволяет другим компаниям использовать его без аналогичных затрат на лицензирование.
Ключевой момент: Здесь возникает парадокс: если данные становятся общей собственностью, то теряется вся логика инвестиций в их создание. Это может привести к тому, что компании перестанут вкладывать средства в качественный контент, опасаясь, что он будет использован без компенсации. Примером такого рода споров стал иск, поданный The New York Times против Perplexity, которая обвинялась в использовании контента без разрешения [!].
Важный нюанс: Борьба Google с SerpApi — это не только юридический спор. Это попытка установить новый стандарт, где контроль над данными становится важнее, чем их доступность. Если Google победит, это закрепит за крупными платформами монопольное право на информацию.
Связь с предыдущими исками и трендом
Это не первый подобный иск. В этом же году Reddit подала иск против SerpApi и других компаний за сбор данных с их сайта. Подобные действия указывают на то, что крупные платформы начинают активно защищать свои данные, особенно в условиях роста интереса к ИИ, где данные — это топливо. SerpApi включена в список ответчиков в иске Reddit, которая обвиняет её в обходе технических защит платформы и Google для нелегального сбора контента [!].
Ключевой момент: В будущем, когда ИИ будет всё больше зависеть от доступа к данным, такие иски могут стать частью новой нормы. Это может привести к тому, что независимые разработчики ИИ столкнутся с серьёзными ограничениями, если не смогут договориться с владельцами данных напрямую. Примером такого подхода может служить соглашение между Reddit и Google, где рассматривается возможность динамического ценообразования на основе вклада контента в эффективность алгоритмов [!].
Важный нюанс: Если компании, занимающиеся сбором данных, не найдут легальных путей для адаптации, они могут потерять не только доступ к данным, но и доверие рынка. Это может привести к тому, что бизнесы, зависящие от стороннего контента, будут вынуждены перестраиваться или исчезнут вовсе.
Долгосрочные последствия для бизнеса
В условиях роста юридической активности со стороны крупных платформ, российский бизнес должен учитывать следующие тенденции:
- Рост стоимости доступа к данным. С увеличением спроса на лицензированный контент, стоимость его использования будет расти. Это особенно касается ИИ-проектов, где данные — ключевой ресурс.
- Необходимость аудита. Для минимизации рисков ключевым становится аудит собственных процессов сбора данных, чтобы исключить нарушения авторских прав.
- Развитие альтернативных источников. Компании, зависящие от стороннего контента, должны искать пути к разработке собственных баз данных или сотрудничеству с владельцами контента на законных основаниях.
Эксперты отмечают, что юридические риски для компаний, использующих ИИ без лицензий, растут. Примером может служить иск Warner Bros. против Midjourney, где компания обвиняется в генерации изображений с известными персонажами без разрешений [!]. Такие дела формируют правовую базу, которая может ограничить свободу действий ИИ-компаний в будущем.
Важный нюанс: В условиях усиления регулирования, бизнесу важно не только соблюдать закон, но и строить долгосрочные отношения с владельцами контента. Это может стать конкурентным преимуществом в отрасли, где данные становятся стратегическим ресурсом.
Источник: The Verge