LLaMA 65B


LLaMA 65B в новостной повестке, календарь упоминаний и aналитика в реальном времени.

Календарь упоминаний:

2026
30 июня

Разброс оценок LLaMA 65B на тесте MMLU составил от 48,8 до 63,7 баллов

Суть: Модель LLaMA 65B демонстрировала значительные расхождения в результатах тестирования из-за отсутствия единых стандартов отчетности и скрытых настроек генерации.

Фактор: Разные отчеты фиксировали для LLaMA 65B на бенчмарке MMLU результаты 63,7 и 48,8 баллов, что делало прямое сравнение невозможным до внедрения стандарта EEE.

Эффект: Внедрение единого JSON-формата позволило зафиксировать точные условия получения баллов для LLaMA 65B, включая версию модели и параметры генерации.

Подробнее →


LLaMA 65B имеет 1 запись событий в нашей базе.