FinePDFs
FinePDFs в новостной повестке, календарь упоминаний и aналитика в реальном времени.
Календарь упоминаний:
2026
30 июня
FinePDFs использован как источник данных для создания медицинского корпуса FineMed
Суть: Исследователи из Doctolib включили репозиторий FinePDFs в конвейер обработки данных для подготовки обучающей выборки медицинских языковых моделей.
Фактор: Данные из FinePDFs совместно с FineWeb-2 и FineWiki прошли трехэтапную фильтрацию и аннотацию для оценки плотности медицинских терминов.
Эффект: Использование материалов из FinePDFs позволило сформировать корпус FineMed объемом 21,1 млн документов для обучения моделей DoctoBERT.
FinePDFs имеет 1 запись событий в нашей базе.