Ух какая жесть, показывающая затянувшееся отсутствие централизованного управления у VK. Потому что весь отдел продвижения и взаимоотношений с аудиторией на этом месте нужно увольнять.
Присутствие знаменитостей и лидеров мнений — одна из важнейших ценностей любой публичной площадки. Во-первых, потому что это повышает уровень доверия у простых людей. Во-вторых, потому что лидеры мнений приводят за собой толпы фанатов.
У VK с этим в основном было плохо. Когда-то всё держалось на Дурове, который сам по себе притягивал аудиторию. Но всё равно писатели и журналисты тусовались в Фейсбуке, актёры и музыканты — в Инстаграме. Даже предельно пророссийские люди вроде Сергея Лукьяненко и Тёмы Лебедева после смерти ЖЖ ушли в американский Фейсбук, который во всём без исключения омерзителен, кроме ровно одной черты — ауры московского снобизма, притягивавшей туда элиты.
Но сейчас, когда оговнение Фейсбука достигло терминального состояния, приведя к блокировкам, для VK наступила золотая лихорадка — знай себе лови авторов. В некоторых ситуациях даже что-то попытались — вот Лебедева к себе перетащили, хотя хвалит он VK очень неубедительно, Инсту свою рекламирует до сих пор, а вместо ведения паблика его редакторы просто копипастят древние записи. В некоторых ситуациях, наоборот, проявили удивительную небрежность — почему российский политик Медведев ведёт текстовый блог в де-факто иностранном Телеграме, а не в VK?
Но вот с этими верификациями это просто стыд и позор. В комментариях другой известный русский писатель — Алексей Пехов — тоже указывает на аналогичную проблему.
Ладно, допустим в VK нет достаточно разумного топа, который настучит по голове тем, кто систематически пытается искусственно поднять счётчики у мертворождённых историй. Но хотя бы для реальных знаменитостей могли бы сделать исключение.
#web
Image to Text OCR is a utility website made by Alejandro Akbal for extracting text from any image using #OCR.
This tool was made for those moments where you take a photo of some text and wish you could have it digitally.
https://github.com/AlejandroAkbal/Image-to-Text-OCR
Online: https://image-to-text-ocr.netlify.app/
🦉 LightOnOCR-1B: новая быстрая OCR-модель от LightOn
Модель дистиллирована из Qwen2-VL-72B-Instruct и обучена на корпусе из 17.6 млн страниц / 45.5 млрд токенов.
🔥 Главное:**
-1 B параметров
- позволяет обрабатывать 5.7 страниц/с на одном H100 (это примерно ≈ 493 000 страниц за день)
- Распознаёт таблицы, формы, уравнения и сложные макеты
- 6.5× быстрее dots.ocr, 1.7× быстрее DeepSeekOCR
- Расходы < $0.01 за 1000 страниц A4
📊 Качество (Olmo-Bench):
- Превосходит DeepSeekOCR
- Сопоставима с dots.ocr (при этом модель в 3 раза меньше по весу)
- +16 пт к Qwen3-VL-2B-Instruct
Эта моделька - отличный баланс качества, скорости и стоимости.
🟢Модель 1B: https://huggingface.co/lightonai/LightOnOCR-1B-1025
🟢Модель 0.9B (32k): https://huggingface.co/lightonai/LightOnOCR-0.9B-32k-1025)
🟢Блог LightOn:https://huggingface.co/blog/lightonai/lightonocr
🟢Демка: https://huggingface.co/spaces/lightonai/LightOnOCR-1B-Demo
@ai_machinelearning_big_data
#ocr#ml
📄 DeepSeek-OCR - модель для распознавания текста 🔍
DeepSeek выпустили мощную OCR-модель, способную преобразовывать изображения документов прямо в Markdown или текст.
Что умеет:
- Распознаёт текст на изображениях и в PDF
- Работает с документами, таблицами и сложными макетами
- Поддерживает разные режимы: Tiny, Small, Base, Large
- Оптимизирована под GPU (PyTorch + CUDA 11.8)
- MIT-лицензия — можно свободно использовать и модифицировать
DeepSeek-OCR достигает высокой точности и эффективности за счёт компрессии визуальных токенов. На Omnidocbench - лучшая точность при минимуме визуальных токенов, превосходит другие OCR-модели по эффективности и скорости.
🟠HF: https://huggingface.co/deepseek-ai/DeepSeek-OCR
🟠Github: https://github.com/deepseek-ai/DeepSeek-OCR
🟠Paper: https://github.com/deepseek-ai/DeepSeek-OCR/blob/main/DeepSeek_OCR_paper.pdf
@ai_machinelearning_big_data
#ocr#DeepSeek