Приветствую, айти специалистов!
Прошу знающих поделиться опытом. Не могу определиться каким лучше способом выполнить задачу.
Имеется изображение. Это скан документа.
Задача: Идентифицировать абзац АДРЕСАТ и вытащить текст из абзаца адресата ( поля Кому и Куда), то есть ФИО, почтовый адрес, индекс указанные в документе.
Каким образом лучше это сделать?
Разбить текст на абзацы, распознать всю текстовую информацию в абзацах и выбрать именно тот, где идут подряд 6 чисел( то есть индекс), без знаков пробелов и других знаков в виде тире и т.д. (чтобы исключить возможность идентификации абзаца типа "адрес" в совсем другом абзаце, например где-то будет прописан номер документа 142-25-2 или есть более эффективный способ.
Прошу помощи в выборе алгоритма действий и какие библиотеки лучше использовать.
Прошу знающих поделиться опытом. Не могу определиться каким лучше способом выполнить задачу.
Имеется изображение. Это скан документа.
Задача: Идентифицировать абзац АДРЕСАТ и вытащить текст из абзаца адресата ( поля Кому и Куда), то есть ФИО, почтовый адрес, индекс указанные в документе.
Каким образом лучше это сделать?
Разбить текст на абзацы, распознать всю текстовую информацию в абзацах и выбрать именно тот, где идут подряд 6 чисел( то есть индекс), без знаков пробелов и других знаков в виде тире и т.д. (чтобы исключить возможность идентификации абзаца типа "адрес" в совсем другом абзаце, например где-то будет прописан номер документа 142-25-2 или есть более эффективный способ.
Прошу помощи в выборе алгоритма действий и какие библиотеки лучше использовать.