TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #15573 · Mar 19

#java#a11y#accessibility#ai#bounding_box#document_parsing#eaa#html#json#markdown#ocr#ocr_recognition#pdf#pdf_accessibility#pdf_converter#pdf_extraction#pdf_parser#pdf_ua#rag#tables#tagged_pdf OpenDataLoader PDF is a free, open-source tool (Apache 2.0) that tops benchmarks with 0.90 accuracy for extracting structured data like Markdown, JSON (with bounding boxes), and HTML from any PDF—digital, scanned, or complex with tables, formulas, charts, and OCR in 80+ languages. It runs locally on CPU (0.05s/page fast mode), filters AI prompt injections for safety, integrates with LangChain/RAG, and automates accessibility tagging to Tagged PDF. You save time and costs on parsing for AI pipelines or compliance (vs. $50–200/manual doc), getting precise, private results for better LLM apps and legal standards. https://github.com/opendataloader-project/opendataloader-pdf

Results

1 similar post found

Search: #datasolutionsarchitect

当前筛选 #datasolutionsarchitect清除筛选
Data Science Jobs

@datasciencejobs · Post #2689 · 04/22/2025, 09:31 AM

#DataSolutionsArchitect#AISolutionsArchitect#MLops#ml Компания JTI (Japan Tobacco International) находится в поиске Архитектора информационных решений Формат работы: гибрид, Москва Сити, полная занятость Чем Вы будете заниматься: - Разрабатывать и внедрять архитектуру Data и AI и обеспечивать создание инфраструктуры. - ⁠Обеспечивать надлежащее управление и поддержку любого компонента в экосистеме; - Обеспечивать производительность ML-моделей (обновление данных, запуск моделей, получение и передача результатов любым получателям); - Обеспечивать интеграцию и доступность данных для любых проектов Data и ML - ⁠Источники данных -> DWH - ⁠DWH -> ML-проекты - ⁠Результаты ML-модели -> DWH - Обеспечивать хорошую производительность любой опубликованной ML-модели; - Внедрять DevOps, MLOps, DataOps в рамках соответствующих инициатив; - Обеспечивать техническое управление в соответствии с глобальными политиками и процедурами. Мы ожидаем от Вас: - 6+ лет опыта работы в области ИТ с фокусом на разработку и развитие платформ данных, ML, AI; - Опыт ведения проектов по внедрению платформ данных с фокусом на крупные компоненты хранения данных, расположенные в облачной и локальной инфраструктуре; - Опыт ведения проектов генеративного ИИ/традиционных решений ML и обладание знаниями сетевой/облачной архитектуры; - Опыт работы с такими языками программирования, как Python или Javascript; - Знание принципов DevOps и MLOps; - Владение уверенным уровнем английского языка. Контакты для отклика и отправки резюме: [email protected], @KaterinaJTI