Lia logo
ПРОЕКТ
Система распознавания рукописных источников
Руководитель
User logo
Сергей
Боловцов
Требования для входных данных
  1. Одна книжная страница.
  2. Сфотографирована с помощью любого устройства, находящегося параллельно странице.
  3. Изображение может иметь любое разрешение, однако, чем больше, тем лучше.
  4. Строки изображений должны быть написаны «рядами»
  5. Могут быть в формате .png и .jpg.
exImg
exImg
exImg
exImg
exImg
exImg
паплайн предложенного подхода
dot icon
1 шаг
Изображение исторического документа
2 шаг
Предобработка изображения
3 шаг
Обнаружение строк на изображении
4 шаг
Преобразование изображения в строки
right icon
архитектура решения
  • Двухуровневая архитектура решения;
  • Нейронная сеть YOLOv8 совмещает в себе лучшие практики детекции и сегментации изображений;
  • Нейронная сеть TrOCR построена на архитектуре Transformer (предобученный энкодер для фрагментов изображения и предобученный текстовый декодер для генерации последовательности слов)
архитектура YOLOv8 для детекции текста
image banner
архитектура TROCR для распознавания задетектированного текста
image banner
Статистика и метрики
exImg1
exImg2
exImg3
exImg4
значимость и внедрение
  1. в рамках проекта НЦМУ "Исследование процессов формирования и развития человеческого капитала в России в глобальном контексте: долгосрочные тенденции, факторы, структурная динамика (с XIX в. поXXI в.)" (руководитель - Кончаков Р.Б.)
  2. сотрудничество с Президентской библиотека имени Б.Н. Ельцина (г.Санкт-Петербург)
Project img
примеры похожих решений
    • к проекту «Система распознавания рукописных источников»
    Остались вопросы?
    задайте вопрос в форме
    LIA LogoRanepa LogoION Logo
    КОНТАКТЫ
    +7 495 937 07 44
    bolovtsov-sv@ranepa.ru
    Адрес
    119571, г. Москва,
    пр-т Вернадского 82 корпус 2;
    офисы: 221