Qwen3-4B
Qwen3-4B в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
Qwen3-4B теряет в эффективности при обновлении библиотеки transformers
Суть: В ходе тестирования инструмента agent-eval модель Qwen3-4B продемонстрировала негативную реакцию на добавление документации и командной строки в библиотеку transformers.
Событие: В сценарии Clone расход токенов моделью Qwen3-4B вырос с ~2.4k до ~23k, что составляет увеличение в 10 раз.
Эффект: Несмотря на десятикратный рост потребления ресурсов, точность выполнения задач моделью Qwen3-4B не улучшилась.
Риск: Обновление интерфейса, полезное для крупных моделей, может привести к резкому удорожанию работы малых моделей без прироста качества.
Метод PA-DR снижает утечки данных в модели Qwen3-4B до 9,9%
Исследование: На модели Qwen3-4B был протестирован метод обучения с подкреплением Privacy-Aware Deep Research (PA-DR), оценивающий каждый шаг агента на сохранение приватности.
Эффект: Применение методики позволило снизить уровень утечки ответов и информации с 34,0% до 9,9% при сохранении высокой успешности решения задач.
Фактор: Обучение только на повышение точности ответов привело к росту утечек в Qwen3-4B с 34,0% до 51,7%, так как модель стала включать больше контекста в запросы.
Инсайт: Метод PA-DR достиг целевого уровня точности в 5–6 раз быстрее по количеству обучающих примеров по сравнению со стандартными подходами.
Qwen3-4B имеет 2 записи событий в нашей базе.