TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Academy
Python Academy avatar

TGINSIGHT POST

Post #1387

@python_academy

Python Academy

Views7,490Post view count
PostedJul 2107/21/2023, 11:46 AM
Post content

Post content

Превращаем PDF в текст Думаю, все периодические работают с PDF-документами. И зачастую это ручная и скучная работа. Но Python может автоматизировать даже такую рутинную задачу. Модуль pdftotext создан именно для работы с документами в PDF формате. Устанавливается он через пакетный менеджер pip, а использовать его проще простого. Все основные операции представлены на картинке выше. Кстати, здесь ещё интересно то, что исходный код модуля написан на C++. Поэтому есть небольшая вероятность, что придётся повоевать с зависимостями. #pdftotext