FineMed
FineMed в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
Команда Doctolib создала корпус FineMed из 21,1 млн документов для медицинских моделей
Суть: Корпус FineMed объемом 21,1 млн документов сформирован командой Doctolib для обучения медицинских энкодеров на основе автоматизированной фильтрации и переписывания веб-контента.
Исследование: При создании FineMed ключевым критерием отбора стала плотность медицинских терминов, которая оказалась эффективнее оценки образовательного качества текста.
Событие: 20 июня 2026 года корпус FineMed и обученные на нем модели DoctoBERT были опубликованы в открытом доступе на Hugging Face Hub и GitHub.
Эффект: Использование данных FineMed позволило моделям DoctoBERT превзойти существующие решения в задачах распознавания сущностей и классификации диагнозов на французском языке.
Риск: Качество итогового корпуса FineMed зависит от точности модели переписывания, что создает риск появления фактических ошибок при генерации текстов.
FineMed имеет 1 запись событий в нашей базе.