TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Academy
Python Academy avatar

TGINSIGHT POST

Post #1303

@python_academy

Python Academy

Views8,010Post view count
PostedJun 106/01/2023, 09:11 AM
Post content

Post content

Превращаем PDF в текст Думаю, все периодические работают с PDF-документами. И зачастую это ручная и скучная работа. Но Python может автоматизировать даже такую рутинную задачу. Модуль pdftotext создан именно для работы с документами в PDF формате. Устанавливается он через пакетный менеджер pip, а использовать его проще простого. Все основные операции представлены на картинке выше. Кстати, здесь ещё интересно то, что исходный код модуля написан на C++. Поэтому есть небольшая вероятность, что придётся повоевать с зависимостями. #pdftotext