TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #987 · 31.05

Под влиянием поста Беспалова подумал о том, что для меня все виды деятельности располагаются в матрице "Интерес - Понимание". 1. Неинтересно и непонятно: артхаус-кино, современная молодёжная музыка, низкоуровневое программирование, тикток, животноводство, скульптура, эстонский язык и т.д. Все вещи, которые нельзя постичь беглым взглядом или просто в рамках обычной бытовой жизни, а погружаться сильнее мне не хочется, потому что они вызывают либо нейтральные эмоции, либо отрицательные. Если вкусы мои не изменятся, то вряд ли я когда-либо стану ими заниматься. Разве что за очень много денег или под давлением обстоятельств. 2. Неинтересно, но понятно: футбол, выращивание картошки на огороде, программирование на PHP, старые видеоигры, мытьё полов, инстаграм, плёночная фотография, городское фентези и т.д. Вещи, в которые я погружен хотя бы чуть-чуть в силу обстоятельств и окружающей среды, в процессе обычного быта, либо потому что они очень простые и примитивные. Но при этом никакого желания и интереса у меня нет. Иногда я чем-то таким занимаюсь из-за необходимости: ради друга можно сыграть в старую видеоигру, ради чистоты в квартире помыть пол, ради огромных денег написать что-то на PHP. Но в целом это рутина из-под палки. 3. Интересно, но непонятно: топология, кузнечное ремесло, рисование, столярное дело, большой теннис, плавание с аквалангом, теория струн, функциональное программирование и т.д. Всё, что вызывает интерес, но до чего я не добрался и, возможно, никогда в жизни не доберусь. Мир слишком многообразный, нельзя объять необъятное, нельзя заниматься абсолютно всем. Но в этом списке потенциальные претенденты на какое-нибудь будущее хобби. И ещё всегда может оказаться, что после погружения мне это дело не понравится, либо я обнаружу у себя отсутствие способностей к нему. 4. Интересно и понятно: работа (программирование на C#, управление командой, архитектура), текущие хобби (настолки, электроника, 3D-печать), замороженные хобби (мотоциклы, дроны, пет-проекты), совместный досуг с семьёй. Это то, чем я занимаюсь, если могу. Скажем, дроны заблокированы на неопределённый срок, мотоциклы на паузе, но при возникновении обстоятельств я к этим вещам буду возвращаться. А если условия есть, то, собственно, эти занятия и составляют основную часть моего времени жизни. #life

Hashtags

Резултати

Намерени 2 подобни публикации

Търсене: #paddleocr

当前筛选 #paddleocr清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #9453 · 30.01.2026 г., 10:05

🌟PaddleOCR-VL-1.5: компактная модель для сложного парсинга. PaddlePaddle обновили свою линейку PaddleOCR-VL, выпустив PaddleOCR-VL-1.5 - компактную VLM на 0.9 млрд. параметров на базе ERNIE-4.5-0.3B-Paddle. Несмотря на скромный размер, в задачах разбора документов она показывает SOTA-результаты. На тесте OmniDocBench v1.5 модель выбила 94.5% точности, обойдя не только прошлую версию, но и более тяжелых конкурентов. Фишка обновления - упор на полевые условия. Модель специально учили работать с плохими исходниками: кривыми сканами, бликами от мониторов и мятыми страницами. Попутно сделали бенчмарк Real5-OmniDocBench, который гоняет модели по 5 сценариям: сканирование, перекосы, деформация листа, фото с экрана и плохое освещение. 🟡В 1.5 добавили: 🟢Text spotting: находит и распознает текст одновременно (печатный русский - неплохо, рукописный - почти никак) 🟢Seal recognition: распознает печати (русские - не очень, китайские - на ура). 🟢Cross-page table merging: умеет склеивать таблицы, которые разорваны между страницами. 🟢Работа с заголовками: не теряет структуру параграфа при переходе на новый лист. 🟢Новые языки: добавили поддержку тибетского и бенгальского, подтянули распознавание редких символов и древних текстов. 🟡Деплой - на любой вкус Модель работает с transformers, дружит с Flash Attention 2 и, само собой, поддерживается PaddlePaddle 3.2.1. Если нужно быстро поднять сервис - есть готовый Docker-образ. 🟡Пара важных моментов по использованию Если нужен полноценный постраничный парсинг всего документа, лучше использовать официальный пакет PaddleOCR. Реализация через transformers пока ограничена только распознаванием отдельных элементов и споттингом. В пайплайн встроили логику препроцессинга. Если картинка меньше 1500 пикселей, она автоматом апскейлится фильтром Lanczos. При этом есть потолок в 1.6 млн. пикселей для споттинга, это чтобы не перегружать память GPU и сохранить читаемость мелкого шрифта. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🟡Demo 🟡DeepWiki 🖥Github @ai_machinelearning_big_data #AI#ML#VL#OCR#PaddleOCR

Machinelearning

@ai_machinelearning_big_data · Post #8792 · 16.10.2025 г., 14:10

📄PaddleOCR-VL (0.9B) — компактная Vision-Language модель нового поколения Команда Baidu AI представила PaddleOCR-VL (0.9B) — сверхлёгкую VLM-модель, которая достигает SOTA-точности в задачах распознавания: - текстов, - таблиц, - формул, - графиков 💡Под капотом: - NaViT - динамический vision-энкодер - ERNIE - облегчённая языковая модель от Baidu ⚡️ Поддержка 109 языков. 🟠GitHub: https://github.com/PaddlePaddle/PaddleOCR) 🟠HuggingFace: https://huggingface.co/PaddlePaddle/PaddleOCR-VL 🟠Docshttps://paddleocr.ai/latest/en/index.html @ai_machinelearning_big_data #BaiduAI#PaddlePaddle#Ernie#PaddleOCR#VisionLanguage#AI#OCR