После экспорта из PDF в Word (через) в файле остается много не нужных артефактов в тексте:
- бессмысленные части картинок
- пустые таблицы из 1 ячейки
Нужно реализовать следующее решение на базе Python и Google Colab:
1. Добавляю файл Word, через кнопку “загрузить”.
2. Вывести в интерфейсе миниатюры всех изображений и таблиц (в 1 экземпляре) с галочкой рядом.
3. Снимаю галочки у не нужных изображений и таблиц.
4. Подтверждаю.
5. Из файла Word удаляются изображения и таблицы, с которых я снял галочки.
6. Авто-скачивание файла Word на ПК.
Скрипт для удаление изображений и таблиц из Word
Образец файла
Таблица выводит в интерфейс.
Изображения и фигуры из word не выводит. Помогите, пожалуйста, найти ошибку. Что поправить?
- бессмысленные части картинок
- пустые таблицы из 1 ячейки
Нужно реализовать следующее решение на базе Python и Google Colab:
1. Добавляю файл Word, через кнопку “загрузить”.
2. Вывести в интерфейсе миниатюры всех изображений и таблиц (в 1 экземпляре) с галочкой рядом.
3. Снимаю галочки у не нужных изображений и таблиц.
4. Подтверждаю.
5. Из файла Word удаляются изображения и таблицы, с которых я снял галочки.
6. Авто-скачивание файла Word на ПК.
Скрипт для удаление изображений и таблиц из Word
Google Colab
colab.research.google.com
Таблица выводит в интерфейс.
Изображения и фигуры из word не выводит. Помогите, пожалуйста, найти ошибку. Что поправить?