DeepSeek
DeepSeek в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний. Страница 3:
Рост производительности в задачах с высокими требованиями к латентности
Тестирование систем NVIDIA GB300 NVL72 на базе архитектуры Blackwell Ultra с участием моделей DeepSeek показало значительное повышение производительности в задачах с чувствительной к задержке обработкой. В сравнении с предыдущей версией — GB200 NVL72 — новая архитектура демонстрирует улучшение в 1,5 раза, достигая пиковой пропускной способности 226,2 токена в секунду на GPU. Модели DeepSeek были включены в тесты как примеры открытых моделей, на которых проверялись оптимизации, включая PD Disaggregation и MTP. Результаты подчеркивают важность DeepSeek в оценке прогресса в обработке длинных контекстов и сценариев с низкой латентностью.
Рост активности ИИ-моделей на OpenRouter
DeepSeek представлен как один из участников экосистемы открытых ИИ-моделей, доступных через платформу OpenRouter, которая зафиксировала резкий рост использования AI-токенов. В неделю, завершившуюся 9 февраля, OpenRouter обработала 13 триллионов токенов, что вдвое больше, чем в первой неделе января. Среди моделей, доступных на платформе, — решения от DeepSeek и других компаний, что подчеркивает его роль в растущем спросе на ИИ.
Угроза для американской ИИ-доминанты: обвинения в дистилляции DeepSeek
Компания DeepSeek, базирующаяся в Hangzhou, обвиняется OpenAI в использовании метода дистилляции для ускорения развития собственных моделей искусственного интеллекта. Согласно письму, направленному в комиссию Палаты представителей США по Китаю, DeepSeek, возможно, обучала свои модели на выходных данных американских ИИ-систем, включая OpenAI. Для этого, как утверждается, использовались скрытые маршруты, прокси-сервисы и специализированные инструменты. OpenAI подчеркивает, что такие действия нарушают её правила использования моделей и могут подрывать позиции американских разработчиков в глобальной гонке за ИИ.
DeepSeek как локальная ИИ-модель в экосистеме OpenClaw
OpenClaw может работать с локальными моделями искусственного интеллекта, включая DeepSeek, что позволяет ему адаптироваться под отечественные приложения и платформы в Китае. Использование DeepSeek обеспечивает агенту доступ к локализованной ИИ-инфраструктуре, включая крупные облачные платформы, такие как Alibaba, Tencent и ByteDance.
DeepSeek как локальная модель для запуска Moltbot в Китае
DeepSeek — это локальная языковая модель, которую можно использовать для запуска агента искусственного интеллекта Moltbot в Китае. Alibaba Cloud и ByteDance интегрируют Moltbot в свои облачные решения, позволяя пользователям запускать его с применением именно DeepSeek. Это делает модель важным элементом экосистемы, обеспечивая локальную обработку данных и сокращая зависимость от иностранных решений.
DeepSeek имеет 50 записей событий в нашей базе. Объединили похожие карточки: DeepSeek; Deepseek-R1-Distilled-Qwen-14B; Deepseek-R1-Distilled-Qwen и другие.