TGTGInsighttelegram intelligenceLIVE / telegram public index
返回频道列表
AppPie avatar

TGINSIGHT CHAT

AppPie

@AppPie

软件与应用

🌐 网站 apppie.com 欢迎来到 AppPie!我们热衷于探索 Apple 世界的最新变化,并为你筛选出能真正提升体验的高品质应用。 💬 关联群组: @AppPieGroup

Subscribers3,310频道当前订阅规模
Tracked posts1,000频道帖子计数
Recent reach2,440最近帖子视图总和
Recent posts

最近帖子

标签筛选 #pdf · 共 2 条

当前筛选 #pdf清除筛选

发布 4月7日

#Apps OCRmyPDF: 为扫描 PDF 添加 OCR 文本层 🔗GitHub OCRmyPDF 是一个开源的命令行工具和库,它可以为扫描的 PDF 文件添加 OCR 文本层,使文件内容可被搜索和复制粘贴。该工具利用 Tesseract OCR 引擎识别 PDF 中图像里的文本,并将其准确地放置在原始图像下方,使得用户可以轻松地搜索和选择文档中的内容。 OCRmyPDF 的工作原理是分析 PDF 的每一页,确定所需的色彩空间和分辨率,然后使用 Ghostscript 将每页栅格化,接着通过 Tesseract 进行 OCR 处理,并将生成的 OCR 层集成回原始 PDF。与直接使用 ImageMagick 或 Ghostscript 处理图像然后通过 Tesseract OCR 不同,OCRmyPDF 能够生成变化最小的 PDF 输出,同时保留原始图像的精确分辨率。 主要特点 - 多语言支持:支持 Tesseract 的所有语言包,包括英语、法语、中文等 - 图像处理:自动旋转页面、去偏斜、清理背景和图像优化 - PDF/A 生成:默认生成符合 PDF/A 标准的存档文件,便于长期保存 - 批处理能力:支持多核处理,提高 OCR 速度 - 多平台支持:适用于 Linux、macOS、Windows 和 FreeBSD - Docker 支持:提供 Docker 镜像,方便快速部署 - JBIG2 优化:支持 JBIG2 编码,大幅减小黑白图像的文件大小 - 页面选择:允许只对 PDF 中的特定页面进行 OCR 处理 - 扩展性:支持插件系统,可自定义处理流程 部署选项 - 通过 pip 安装:`pip install ocrmypdf` - Docker 容器 - 系统包管理器:支持多种 Linux 发行版和 macOS 的 Homebrew - 从源代码构建 开源许可证 MPL-2.0。 #GitHub#OpenSource#PDF#OCR#CommandLine 📮 频道 @AppPie

1,260 views

发布 3月3日

#Apps Stirling-PDF: 强大的本地 PDF 处理工具 🔗GitHub Stirling-PDF 是一款基于 Docker 的本地部署网页 PDF 处理工具,提供超过 50 种 PDF 操作功能,既保护文件隐私又功能全面。所有文件仅在客户端存在或在任务执行过程中短暂驻留服务器内存,下载后自动从服务器删除。 主要特点 • 50+ 种 PDF 操作功能 • 并行文件处理与下载 • 深色模式支持 • 自定义下载选项 • 自定义「流水线」功能,自动化执行多步操作 • 外部脚本集成 API • 可选登录与认证支持 • 数据库备份与导入 • 企业级功能如 SSO • 支持 39 种语言 PDF功能集合 页面操作: • 查看和编辑 PDF(注释、绘图、添加文本和图片) • 合并、拆分、旋转、移动页面的完整互动界面 • 多页布局、调整对比度、裁剪 PDF • 自动拆分 PDF(使用物理扫描页面分隔符) • 页面内容缩放、提取页面等 转换操作: • PDF 与图片互转 • 常见文件转 PDF(使用 LibreOffice) • PDF 转 Word/PowerPoint • HTML/URL/Markdown 转 PDF 安全与权限: • 添加/移除密码 • 更改 PDF 权限 • 添加水印 • 认证/签名 PDF • 净化 PDF、自动编校文本 其他操作: • 添加/生成签名 • 按大小分割 PDF • 修复 PDF • 检测并移除空白页 • 对比两个 PDF 的文本差异 • OCR (使用 Tesseract OCR) • PDF/A 转换 • 编辑元数据等 #GitHub#OpenSource#SelfHosted#PDF#Docker 📮 频道 @AppPie

1,180 views