Как с помощью Python из файла Word удалить ненужные изображения и таблицы?

rownong

Новичок
Пользователь
Фев 1, 2025
3
0
1
После экспорта из PDF в Word (через) в файле остается много не нужных артефактов в тексте:
- бессмысленные части картинок
- пустые таблицы из 1 ячейки

Нужно реализовать следующее решение на базе Python и Google Colab:
1. Добавляю файл Word, через кнопку “загрузить”.
2. Вывести в интерфейсе миниатюры всех изображений и таблиц (в 1 экземпляре) с галочкой рядом.
3. Снимаю галочки у не нужных изображений и таблиц.
4. Подтверждаю.
5. Из файла Word удаляются изображения и таблицы, с которых я снял галочки.
6. Авто-скачивание файла Word на ПК.

Скрипт для удаление изображений и таблиц из Word
Образец файла

Таблица выводит в интерфейс.
Изображения и фигуры из word не выводит. Помогите, пожалуйста, найти ошибку. Что поправить?
 

rownong

Новичок
Пользователь
Фев 1, 2025
3
0
1
Доступ к файлу гугл колаб открыл.
 

Форум IT Специалистов