TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #851 · 2.08

Впервые использовал нейросетку для реальной практической пользы в коммерческом заказе. У заказчика есть база данных, куда информация вносится кое-как. Представьте, что вы составляете каталог, например, книг, и в базе данных предусмотрены поля: "Автор книги", "Название книги", "Число страниц" и ещё десяток других полей с информацией. Но заполняют эту базу другие люди, которых вы не контролируете, поэтому информация может случайным образом лежать в любом произвольном поле, быть введена с ошибками, опечатками и так далее. В реальном заказе были не книги, я просто привожу пример такой же задачи. Вот как это может выглядеть: 1. В поле "Автор" написано "Лондон, Дж. Белый Клык", поле "Название" при этом пустое. 2. В поле "Название" написано "150-страничный сборник рецептов", поле "Число страниц" пустое 3. В поле "Название" написано "джеклондон мартин иден", поле с автором пустое 4. В поле "Автор" написано "150-стр.3изд,доп.перераб инструкция по пользованию подстанциями типа ТП-13, М.Васильев москва 98" ...и так далее. А нужно искать нормально по автору, названию, числу страниц, городу и году издания. Никакими прямыми алгоритмами это не берётся: регулярки, поиск по ключевым словам, морфология, нечёткая логика — всё это либо даёт много ложноположительных результатов, либо (если подкрутить пороговые значения) вообще перестаёт искать. И вот тут в какой-то момент мы решили попробовать запрашивать через API GPT. Нейросетке задаётся следующий промт: "Есть следующая информация: «150-страничный роман джеклондон мартин иден». Если здесь есть то, что похоже на имя автора книги, напиши мне его, иначе ответь null". И, надо сказать, даже 3.5 справляется с этой работой очень хорошо. Получилось сравнительно без ошибок разметить около 80% данных (остальные с ошибками даже после нейросетки). Но, важный нюанс. Сначала мы пытались поймать все данные одним запросом: "GPT, выведи мне JSON, в котором есть автор, название, число страниц...", но тесты показали, что значительно эффективнее будет отдельно спросить 5 раз про 5 разных типов данных. Да, это расходует больше токенов, но они и так сравнительно дёшевы. Кстати, API у OpenAI безбожно глючит даже на платном тарифе. Обещанных 3500 запросов в минуту нет даже приблизительно. По факту удаётся отправлять около 200-300 запросов в минуту, потом оно вываливается в таймауты или ошибку 429, нужно делать какие-то умные паузы, ждать итд. Над этим всем пришлось повозиться, зато результат вполне ощутимый. #dev

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #captioning

当前筛选 #captioning清除筛选
Libreware

@libreware · Post #1192 · 06.10.2023 г., 11:18

#Linux Desktop application that provides live #captioning FUTO Fellowship program interview; linux captions software 👉 Live Captions github: https://github.com/abb128/LiveCaptions 🔵 Q&A w/ billionaire alt-tech investor/philanthropist Eron Wolf https://www.youtube.com/watch?v=OJPmbcU-Vzo 🔵 FUTO Fellows program: https://futo.org/fellows/ 🔵 FUTO Youtube channel - @futotech ⚠️ Google's breaches of privacy have gone TOO FAR! https://www.youtube.com/watch?v=_vWAF13KigI #speech#recognition#stt#voice

✍️ JoyCaption Ultimate α2 (2024-09-26) ● Генератор описаний и тегов для изображений с режимом пакетной обработки ● RU ● by NerualDreming & Slait Ссылка на оригинальный GitHub:https://github.com/fpgaminer/joycaption Репакеры: #NerualDreming, #Slait Дата обновления модели: 26 сентября 2024 Версия: α2 Категории:#captioning, #AIvision, #img2txt Платформа:#Windows Язык: RU Место на диске: 20 ГБ Системные требования: NVIDIA GPU 12gb VRAM Совместимость:#Nvidia 🖥Описание софта: JoyCaption — инструмент для генерации подробных описаний изображений в различных стилях и форматах. Незаменим для создания описаний изображений при подготовке тренировочных датасетов. Полезен для получения промптов из любых изображений. Адекватно работает с NSFW-концепциями и тегами. В этой русифицированной модифицированной сборке добавлена поддержка пакетной обработки файлов, сохранение обработанных изображений в директорию проекта, перевод интерфейса и многое другое для удобства работы. Всё работает локально, используя квантованную модель nf4 для экономии ресурсов и увеличения скорости обработки. 😬 Основные возможности JoyCaption α2: 🟣9 режимов генерации (описание, SD-промпты, MidJourney, booru-теги, соцсети и др.) 🟣Расширенные инструкции: имя персонажа, свет, композиция, глубина, качество 🟣Формальный и неформальный стиль 🟣Выбор длины описания 🟣Поддержка пользовательских промптов 🟣Сохранение промптов и изображений в отдельную папку 🟣Возможность визуально проверить и исправить вручную неудачные промпты в пакетном режиме, с повторным сохранением по одному, или всех сразу 🟣Переведённый UI и простой запуск 💿Установка и запуск: ⁍ Скачайте 7z архив JoyCaption с установщиком или с окружением ⁍ Разархивируйте с помощью 7-Zip ⁍ Распакуйте архив в удобное место (без кириллицы и пробелов в пути) ⁍ Запустите файл installer.bat если скачали установщик ⁍ Запустите файл start_joy_caption.bat если скачали версию с готовым окружением ⁍ После загрузки моделей интерфейс откроется в браузере ➡️ Скачать архиватор 7z ➡️joy_caption_ultimate_portable_installer.7z — установщик, всё скачает сам ➡️joy_caption_ultimate_portable_environment.7z — готовое окружение, скачиваются только модели 💬Обсудить в чате | ⭐️Поддержать канал 👾НЕЙРО-СОФТ — Делаем нейросети доступнее.

✍️ SuperCaption Qwen3-VL ● Ультимативный генератор описаний ● Portable by Nerual Dreming & Slait Ссылка на оригинальный GitHub: https://github.com/timoncool/SuperCaption_Qwen3-VL Репакеры:#NerualDreming, #Slait Дата обновления: 26 ноября 2025 Версия: 1.0 Категории:#captioning, #img2txt, #AIvision, #video2txt, #OCR, #dataset Платформа:#Windows Язык: RU, EN, CN Место на диске: ~15 ГБ (зависит от модели) Системные требования: NVIDIA GPU (минимум 6 ГБ VRAM для 2B модели, рекомендуется 12+ ГБ для 8B+) Совместимость:#Nvidia 🖥Описание софта SuperCaption Qwen3-VL — это мощнейший комбайн для анализа визуального контента. В его основе лежит модель Qwen3-VL, которая "видит" мир лучше многих конкурентов. Главная фича — использование Abliterated моделей, у которых отключена цензура. Это значит, что софт опишет абсолютно всё, что вы ему покажете, без морализаторства и отказов. Идеальный инструмент для дата-сайентистов, контент-мейкеров и всех, кому нужно превратить гигабайты картинок и видео в структурированный текст. 😬Основные возможности SuperCaption Qwen3-VL Работа с изображениями (50+ режимов): 🟣Генерация промптов: Создает готовые промпты для Stable Diffusion и MidJourney, теги в стиле Booru. 🟣Маркетинг и SEO: Пишет продающие описания товаров, SEO-тексты (до 160 символов), посты для соцсетей. 🟣 Продвинутый OCR: Распознает текст на 20+ языках, конвертирует таблицы с картинок сразу в HTML-код, извлекает данные в JSON. 🟣Сравнение и анализ: Режимы "До/После", сравнение товаров, контроль качества (поиск дефектов), анализ временных рядов. 🟣Object Detection: Находит объекты и выдает их координаты (bbox) в JSON или рисует рамки прямо на фото. Интеллектуальный анализ: 🟣Thinking Mode: Режим "рассуждений" для сложных задач — модель сначала думает, потом отвечает. 🟣Решение задач: Пошаговое решение математики, физики, разбор учебных заданий. 🟣Аналитика: Читает графики, диаграммы, технические чертежи и медицинские снимки. Видео-аналитика: 🟣Таймлайны: Создает хронологию событий с таймкодами. 🟣Саммари: Делает краткую выжимку содержания длинных видео. 🟣Анализ монтажа: Оценивает склейки, переходы, темп и операторскую работу. 🟣Поиск действий: Находит конкретные моменты (например, "когда человек начал бежать"). Прочее: 🟣Пакетная обработка: Закидываете папку с тысячей файлов -> идете пить кофе -> получаете TXT/JSON/CSV файлы для каждого. 🟣Гибкость: Полная поддержка кастомных промптов на русском языке. 💿Установка и запуск ⁍ Скачайте архив SuperCaption_Qwen3-VL. ⁍ Распакуйте в удобное место (путь без кириллицы!). ⁍ Запустите install.bat и выберите свою видеокарту. ⁍ Нажмите Enter и дождитесь окончания установки. ⁍ Запустите run_with_update.bat для старта. ⁍ Интерфейс откроется в браузере (http://127.0.0.1:7860). ➡️Скачать SuperCaption с GitHub — исходный код ➡️Скачать Portable установщик — скачает все что нужно ➡️Скачать Portable архив с окружением — Окружение под Win 11 и RTX 4090 💬Обсудить в нашем чате 👾НЕЙРО-СОФТ - делаем нейросети доступнее