LLaMA 65B
LLaMA 65B в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2026
30 июня
Разброс оценок LLaMA 65B на тесте MMLU составил от 48,8 до 63,7 баллов
Суть: Модель LLaMA 65B демонстрировала значительные расхождения в результатах тестирования из-за отсутствия единых стандартов отчетности и скрытых настроек генерации.
Фактор: Разные отчеты фиксировали для LLaMA 65B на бенчмарке MMLU результаты 63,7 и 48,8 баллов, что делало прямое сравнение невозможным до внедрения стандарта EEE.
Эффект: Внедрение единого JSON-формата позволило зафиксировать точные условия получения баллов для LLaMA 65B, включая версию модели и параметры генерации.
LLaMA 65B имеет 1 запись событий в нашей базе.