Последние месяцы у меня прямо заметное количество человек в Телеграме стали постить сторисы, хотя раньше эти люди обитали в публичном поле исключительно в Инсте.
Сторисы, конечно, ужасный формат, и их существование — великое горе для человечества. Но вот появление Инстаграм-инфицированных людей в публичном пространстве Телеги это хороший признак — Инста, по-видимому, перестаёт давать нужный отклик аудитории в России. Возможно, ещё не всё потеряно.
Что касается остальных блокировок, то наконец-то родительские чатики, сообщества домов и общение с арендодателями квартиры вылезут из Вотсапа (хотя у меня удалён уже много лет). Природа очистится.
Ну и хочу прокомментировать новый закон из Австралии, где запретили соцсети подросткам до 16 лет. Давайте так: соцсети это современный цифровой алкоголь. Его можно уметь употреблять в меру, абсолютное большинство людей так и делает. А детям мы запрещаем его, потому что более менее сошлись в оценке их способности к самоконтролю и взвешенным ответственным решениям. То есть направление мысли понятно, и оно даже отзывается во мне. Хотя я бы может поставил 14 лет.
Но совершенно непонятно:
1. Как вообще технически реализовать выполнение этого закона, если устанавливать VPN современные дети учатся раньше, чем читать?
2. Что мешает получать всё то же самое из источников, формально не являющихся соцсетями? Например, в групповых чатиках в мессенджерах (в том числе в официальных школьных мессенджерах, допустим).
#web@clockstackwheels
Image to Text OCR is a utility website made by Alejandro Akbal for extracting text from any image using #OCR.
This tool was made for those moments where you take a photo of some text and wish you could have it digitally.
https://github.com/AlejandroAkbal/Image-to-Text-OCR
Online: https://image-to-text-ocr.netlify.app/
🦉 LightOnOCR-1B: новая быстрая OCR-модель от LightOn
Модель дистиллирована из Qwen2-VL-72B-Instruct и обучена на корпусе из 17.6 млн страниц / 45.5 млрд токенов.
🔥 Главное:**
-1 B параметров
- позволяет обрабатывать 5.7 страниц/с на одном H100 (это примерно ≈ 493 000 страниц за день)
- Распознаёт таблицы, формы, уравнения и сложные макеты
- 6.5× быстрее dots.ocr, 1.7× быстрее DeepSeekOCR
- Расходы < $0.01 за 1000 страниц A4
📊 Качество (Olmo-Bench):
- Превосходит DeepSeekOCR
- Сопоставима с dots.ocr (при этом модель в 3 раза меньше по весу)
- +16 пт к Qwen3-VL-2B-Instruct
Эта моделька - отличный баланс качества, скорости и стоимости.
🟢Модель 1B: https://huggingface.co/lightonai/LightOnOCR-1B-1025
🟢Модель 0.9B (32k): https://huggingface.co/lightonai/LightOnOCR-0.9B-32k-1025)
🟢Блог LightOn:https://huggingface.co/blog/lightonai/lightonocr
🟢Демка: https://huggingface.co/spaces/lightonai/LightOnOCR-1B-Demo
@ai_machinelearning_big_data
#ocr#ml
📄 DeepSeek-OCR - модель для распознавания текста 🔍
DeepSeek выпустили мощную OCR-модель, способную преобразовывать изображения документов прямо в Markdown или текст.
Что умеет:
- Распознаёт текст на изображениях и в PDF
- Работает с документами, таблицами и сложными макетами
- Поддерживает разные режимы: Tiny, Small, Base, Large
- Оптимизирована под GPU (PyTorch + CUDA 11.8)
- MIT-лицензия — можно свободно использовать и модифицировать
DeepSeek-OCR достигает высокой точности и эффективности за счёт компрессии визуальных токенов. На Omnidocbench - лучшая точность при минимуме визуальных токенов, превосходит другие OCR-модели по эффективности и скорости.
🟠HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR
🟠Github: https://github.com/deepseek-ai/DeepSeek-OCR
🟠Paper: https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf
@ai_machinelearning_big_data
#ocr#DeepSeek