#java#a11y#accessibility#ai#bounding_box#document_parsing#eaa#html#json#markdown#ocr#ocr_recognition#pdf#pdf_accessibility#pdf_converter#pdf_extraction#pdf_parser#pdf_ua#rag#tables#tagged_pdf
OpenDataLoader PDF is a free, open-source tool (Apache 2.0) that tops benchmarks with 0.90 accuracy for extracting structured data like Markdown, JSON (with bounding boxes), and HTML from any PDF—digital, scanned, or complex with tables, formulas, charts, and OCR in 80+ languages. It runs locally on CPU (0.05s/page fast mode), filters AI prompt injections for safety, integrates with LangChain/RAG, and automates accessibility tagging to Tagged PDF. You save time and costs on parsing for AI pipelines or compliance (vs. $50–200/manual doc), getting precise, private results for better LLM apps and legal standards.
https://github.com/opendataloader-project/opendataloader-pdf
Сегодняшнее полнолуние носит поэтическое название Цветочной Луны, потому что обычно (не в этом году, правда) на майские луны приходится пик вегетации. Апрель у меня всегда связан с тревожными желтыми цветами. А вот май - с тревожными синими.
#misc
Тунис, 90е.
Невеста с острова Джерба готовится к местной свадебной церемонии Джелва (фото: Тим Кэролл)
Джелва - древний ритуал, который уходит корнями во времена Карфагена. Невеста как бы принимает в себя богиню Танит (ну, Иштар, по сути), чтобы та благословила ее плодородием и счастьем. Само собой, и значимость, и значение этого ритуала менялось с течением времени , ; особенно- с тех времен, когда тунисцы приняли ислам. Сейчас считается, что Джелва “стоит на 5 колоннах ислама”, и то, как невеста кружится во время ритуала, символизирует кружение мсправоверных мусульман вокруг кааКаабы во время Хаджа. Тем не менее, несмотря на тот смысл, который нес в себе ритуал изначально и какой он несет сейчас, его проводят почти в каждом тунисском городе - от Бизерты (Бинзирт) до Татавина (Татуина, да-да).
#misc