AppPie

@AppPie

软件与应用

🌐 网站 apppie.com 欢迎来到 AppPie！我们热衷于探索 Apple 世界的最新变化，并为你筛选出能真正提升体验的高品质应用。 💬 关联群组: @AppPieGroup

Subscribers3,310频道当前订阅规模

Tracked posts1,000频道帖子计数

Recent reach2,440最近帖子视图总和

最近帖子

标签筛选 #pdf · 共 2 条

当前筛选 #pdf清除筛选

发布 4月7日

查找相似查看

#Apps OCRmyPDF: 为扫描 PDF 添加 OCR 文本层 🔗GitHub OCRmyPDF 是一个开源的命令行工具和库，它可以为扫描的 PDF 文件添加 OCR 文本层，使文件内容可被搜索和复制粘贴。该工具利用 Tesseract OCR 引擎识别 PDF 中图像里的文本，并将其准确地放置在原始图像下方，使得用户可以轻松地搜索和选择文档中的内容。 OCRmyPDF 的工作原理是分析 PDF 的每一页，确定所需的色彩空间和分辨率，然后使用 Ghostscript 将每页栅格化，接着通过 Tesseract 进行 OCR 处理，并将生成的 OCR 层集成回原始 PDF。与直接使用 ImageMagick 或 Ghostscript 处理图像然后通过 Tesseract OCR 不同，OCRmyPDF 能够生成变化最小的 PDF 输出，同时保留原始图像的精确分辨率。主要特点 - 多语言支持：支持 Tesseract 的所有语言包，包括英语、法语、中文等 - 图像处理：自动旋转页面、去偏斜、清理背景和图像优化 - PDF/A 生成：默认生成符合 PDF/A 标准的存档文件，便于长期保存 - 批处理能力：支持多核处理，提高 OCR 速度 - 多平台支持：适用于 Linux、macOS、Windows 和 FreeBSD - Docker 支持：提供 Docker 镜像，方便快速部署 - JBIG2 优化：支持 JBIG2 编码，大幅减小黑白图像的文件大小 - 页面选择：允许只对 PDF 中的特定页面进行 OCR 处理 - 扩展性：支持插件系统，可自定义处理流程部署选项 - 通过 pip 安装：`pip install ocrmypdf` - Docker 容器 - 系统包管理器：支持多种 Linux 发行版和 macOS 的 Homebrew - 从源代码构建开源许可证 MPL-2.0。 #GitHub#OpenSource#PDF#OCR#CommandLine 📮 频道 @AppPie

1,260 views

Hashtags

#apps #github #opensource #pdf #ocr #commandline

发布 3月3日

查找相似查看

#Apps Stirling-PDF: 强大的本地 PDF 处理工具 🔗GitHub Stirling-PDF 是一款基于 Docker 的本地部署网页 PDF 处理工具，提供超过 50 种 PDF 操作功能，既保护文件隐私又功能全面。所有文件仅在客户端存在或在任务执行过程中短暂驻留服务器内存，下载后自动从服务器删除。主要特点 • 50+ 种 PDF 操作功能 • 并行文件处理与下载 • 深色模式支持 • 自定义下载选项 • 自定义「流水线」功能，自动化执行多步操作 • 外部脚本集成 API • 可选登录与认证支持 • 数据库备份与导入 • 企业级功能如 SSO • 支持 39 种语言 PDF功能集合页面操作: • 查看和编辑 PDF（注释、绘图、添加文本和图片） • 合并、拆分、旋转、移动页面的完整互动界面 • 多页布局、调整对比度、裁剪 PDF • 自动拆分 PDF（使用物理扫描页面分隔符） • 页面内容缩放、提取页面等转换操作: • PDF 与图片互转 • 常见文件转 PDF（使用 LibreOffice） • PDF 转 Word/PowerPoint • HTML/URL/Markdown 转 PDF 安全与权限: • 添加/移除密码 • 更改 PDF 权限 • 添加水印 • 认证/签名 PDF • 净化 PDF、自动编校文本其他操作: • 添加/生成签名 • 按大小分割 PDF • 修复 PDF • 检测并移除空白页 • 对比两个 PDF 的文本差异 • OCR （使用 Tesseract OCR） • PDF/A 转换 • 编辑元数据等 #GitHub#OpenSource#SelfHosted#PDF#Docker 📮 频道 @AppPie

1,180 views

Hashtags

#apps #github #opensource #selfhosted #pdf #docker