Всем привет!
Есть PDF файл test.pdf. Нужно спарсить из таблицы ФИО и таб номер.
Накидал вот такой код, но он парсит данные не корректно. ФИО вообще не отображается :
Что я делаю не так и как спарсить данные корректно ?
Есть PDF файл test.pdf. Нужно спарсить из таблицы ФИО и таб номер.
Накидал вот такой код, но он парсит данные не корректно. ФИО вообще не отображается :
Python:
import glob
import pandas as pd
import tabula
file = ("test.pdf")
pdf_files = glob.glob('*.pdf')
pdf_tables = tabula.read_pdf(file,
pages = 'all',
multiple_tables=True,
lattice=True,
encoding="windows-1251")
for table in pdf_tables:
print(pdf_tables[0])
Что я делаю не так и как спарсить данные корректно ?