Распознавание текста в изображение

Lancellot

Новичок
Пользователь
Апр 30, 2020
22
4
3
Приветствую, айти специалистов!
Прошу знающих поделиться опытом. Не могу определиться каким лучше способом выполнить задачу.

Имеется изображение. Это скан документа.
Задача: Идентифицировать абзац АДРЕСАТ и вытащить текст из абзаца адресата ( поля Кому и Куда), то есть ФИО, почтовый адрес, индекс указанные в документе.

Каким образом лучше это сделать?
Разбить текст на абзацы, распознать всю текстовую информацию в абзацах и выбрать именно тот, где идут подряд 6 чисел( то есть индекс), без знаков пробелов и других знаков в виде тире и т.д. (чтобы исключить возможность идентификации абзаца типа "адрес" в совсем другом абзаце, например где-то будет прописан номер документа 142-25-2 или есть более эффективный способ.


Прошу помощи в выборе алгоритма действий и какие библиотеки лучше использовать.
 

Вложения

  • sample.png
    sample.png
    19,9 КБ · Просмотры: 5

Форум IT Специалистов