Google DeepMind
Google DeepMind в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний. Страница 5:
Поддержание эквивалентности моделей требует значительных усилий
Google DeepMind, через своего представителя Филиппа Шмидта, отметил, что обеспечение строгой эквивалентности работы моделей на трех разных аппаратных платформах — AWS Trainium, NVIDIA GPU и Google TPU — требует значительных ресурсов. Это связано с необходимостью синхронизации логики маршрутизации, конфигурации API и компиляции кода. Шмидт также поднял вопрос, стоит ли такие усилия того, учитывая их влияние на скорость разработки и пользовательский опыт.
Нестабильность как показатель потенциала Veo 3
Исследования Google DeepMind показали, что модель Veo 3 способна решать задачи, на которые не была явно обучена, включая восприятие, моделирование и логику. В 60 задачах модель показала положительный результат, в том числе в генерации видео с роботическими действиями и восстановлении изображений. Однако в ряде случаев, таких как сортировка чисел или моделирование горения, модель допускала ошибки. Google DeepMind рассматривает эти сбои как признак потенциала, а не неспособности, поскольку даже частичный успех демонстрирует наличие навыка. Нестабильность результатов, тем не менее, ограничивает возможность применения модели в реальных условиях.
Прорыв в обучении ИИ через модели мира
Google DeepMind активно развивает модели, способные понимать физический мир, обучаясь на видео и данных с роботов. Одним из результатов этой работы стала модель Genie 3, генерирующая видео кадр за кадром на основе предыдущих взаимодействий. Это позволяет ИИ лучше адаптироваться к реальным условиям и открывает возможности в робототехнике и автономных системах.
Роботы DeepMind могут решать комплексные задачи с помощью цифровых инструментов
Google DeepMind представила модели искусственного интеллекта, позволяющие роботам выполнять сложные задачи, используя данные из окружающей среды и цифровые ресурсы, такие как Google Search. Модели Gemini Robotics 1.5 и Gemini Robotics-ER 1.5 работают совместно: первая выполняет действия, вторая преобразует внешнюю информацию в инструкции. Роботы могут сортировать мусор, учитывать погоду при упаковке чемоданов и адаптироваться к местным правилам. Также технологии позволяют переносить навыки между различными роботами, что упрощает их масштабное применение в логистике, производстве и быту.
Влияние Google DeepMind на развитие RL-сред для ИИ-агентов
Google DeepMind активно участвует в разработке сред обучения с подкреплением (RL environments), которые необходимы для тренировки ИИ-агентов в выполнении сложных задач. Эти среды имитируют реальные сценарии, такие как совершение покупок, и предоставляют агентам обратную связь для улучшения их действий. Вместе с другими ведущими лабораториями, DeepMind вкладывает ресурсы в создание внутренних RL-сред, что подчеркивает их важность для будущих агентов.
Google DeepMind имеет 26 записей событий в нашей базе. Объединили похожие карточки: Google DeepMind; DeepMind Technologies Limited; DeepMind Technologies и другие.