TGTGInsightаналитика telegramLIVE / telegram public index
← Machinelearning

TGINSIGHT SIMILAR POSTS

Найти похожее

Источник @ai_machinelearning_big_data · Post #8567 · 17 сент.

⚡️Qwen-ASR Toolkit — мощный Python CLI для быстрой транскрипции длинных аудио и видео Эта утилита снимает ограничение API Qwen-ASR (бывший Qwen3-ASR-Flash) в 3 минуты и позволяет расшифровывать часы контента. Достигается это за счёт умного разбиения записи и параллельной обработки. Основные возможности: - Снятие лимита в 3 минуты - транскрибируй файлы любой длины - Умное разбиение (VAD - это технология, которая определяет, где в аудио есть речь, а где — пауза или шум.) - деление по естественным паузам, без - Высокая скорость - многопоточность и параллельные запросы к API - Автоматический ресемплинг — конвертация в нужный формат 16kHz mono - Поддержка любых форматов — MP4, MOV, MKV, MP3, WAV, M4A и др. - Простота - запуск одной командой через CLI 🟢Установка: pip install qwen3-asr-toolkit 🔗 GitHub: https://github.com/QwenLM/Qwen3-ASR-Toolkit @ai_machinelearning_big_data #asr#speech2text#qwen#opensource#nlp#toolki

Результаты

Найдено 12 похожих постов

🔎 Группа британских ученых создала ИИ-алгоритм для автоматической обработки и извлечения огромных объемов информации из различных документов. Система анализирует содержание и структуру счет-фактур, налоговых форм и других цифровых данных, а затем сортирует их по категориям. 🗣 По словам исследователей, технология упростит открытие банковских счетов, утверждение ипотечных кредитов, ответы на запросы клиентов и обработку страховых требований, ускорив проверку на мошенничество и извлечение сведений из удостоверяющих личность документов. #NLP

Hashtags

🗣 Компания Veritone запустила платформу Marvel.AI для клонирования голоса знаменитостей. По словам разработчиков, любой желающий может создать цифровую копию своего голоса и выставить ее на продажу. Затем образцы речи можно использовать для озвучивания новостей, рекламных роликов и другого контента. 💿 Также платформа может оцифровывать голоса умерших людей. Для этого ей необходимо предоставить их архивные голосовые записи. #NLP

Hashtags

AI Happens

@aihappens · Post #21 · 26.02.2019, 06:30

#nlp#news Опасный ИИ –– OpenAI создала генератор текстов, который работает слишком хорошо Алгоритм GPT-2, натренированный на 40 гигабайтах текстов из интернета, научился писать осмысленные тексты. Он предсказывает каждое следующее слово, подходящее по стилю и содержанию. OpenAI решила не выкладывать в открытый доступ полноценный программный код, полагая, что алгоритм может быть опасным, что сильно расстроило сообщество, ведь компания создавалась именно на принципах полной открытости полученных результатов. Почему важно: В 2015 году лаборатория, основанная Илоном Маском, зарядилась альтруистической целью –– создавать ИИ на благо человечества. Но это было 4 года назад, а сейчас OpenAI побоялась выкладывать свою разработку в открытый доступ. Уж слишком высока вероятность, что ИИ быстро переманят на сторону зла и будут использовать для генерации фейковых новостей и спама. OpenAI создали мощного противника человечества в Dota 2, теперь –– идеального писателя, которому не нужно вдохновение. Эта новость –– отличный повод поговорить о NLP (направление ML по обработке текста) и его ключевых проблемах. Даже самые огромные бюджеты, которые компании тратят на попытки автоматизации службы поддержки и ответы в чатах пользователям, упираются в число 30%. Это средний объем автоматизации сообщений, выше которого прыгнуть сложно, даже внутри одного маленького домена тем. NLP ждет какого-то фундаментального открытия, которое позволит перейти от статистических методов к полноценному deep learning подходу. Возможно алгоритм GPT-2 поможет сдвинуть NLP с текущей мертвой точки.

Hashtags

🌸Про агенты наAGI 2025🌸 #nlp#про_nlp В этом году у меня keynote на AGI conf: буду рассказывать про последние важные работы в LLM-агентах, новые возможности и боттлнеки, которые нам ждут на пути к этому самому Artificial General Intelligence. Frontiers in LLM-Agents for Science Acceleration: can we tackle the scientific progress automation? We will cover the latest advances in AI Agents and major works of the last year, their limitations and new opportunities on the intersection of foundational model advancement, agency and methodology of science. В этом году конференция в Исландии, мой доклад 10 августа по плану, так что увидимся в Рейкьявике! 🟣Сайт конфы: https://agi-conf.org/2025/ 🟣Регистрация на AGI-25 — онлайн можно все посмотреть бесплатно 🟣Еще в рамках конференции проходят воркшопы, в том числе Interpretable NLP: программу уже выложили

🌸Большая Книга ИИ теперь на Вики🌸 #nlp#про_nlp На днях Сергей Марков выложил свою книгу "Охота на электроовец: Большая Книга Искусственного Интеллекта" в формате Вики. Теперь каждую главу можно прочитать (и даже прокомментировать) отдельно, что очень удобно для 1200+ страничного двухтомника. Это самая полная история всего, что происходило, включая весь 20 век и сильно раньше, а так же всеми любимый генИИ и его предпосылки. 🟣Заглавная страница 🟣Оглавление Двухтомник можно скачать в pdf, epub и других форматах: https://markoff.science/

🌸ГиперАгенты, или вперед к Open-Ended Exploration🌸 #nlp#nlp_papers Что будет, если дать агентам полную свободу модифицировать самих себя? Наконец-то выпускаю долгожданную статью, где я побыла уже не соавтором, а научным руководителем. Вместе с Jenny Zhang, автором Darwin Gödel Machine , выпускаем HyperAgents — open-ended self-improvement для агентов, на многих задачах сразу 🌸TL;DR HyperAgents — это пример системы, где агент улучшает самого себя итеративно, от промптов до кода. При этом, в отличие от Darwin Gödel Machine, мы пошли дальше и сделали multi-task objective: — агент должен улучшать сам себя из поколения в поколение, и делать это одновременно на многих задачах сразу. Улучшения возможны в обеих группах доменов: — verifiable rewards: кодинг (Polyglot), математика (IMO), симуляции в робототехнике (Genesis) — unverifiable rewards: рецензирование статей (Apres) 🌸Пайплайн Как и в первой версии DGM, агент вносит модификацию — и затем оценивает ее успешность на основе результатов: в данном случае на бенчмарках, тестах и тд. Модификации образуют граф версий, который можно контролировать в git. В системе всегда работает цепочка из двух агентов: есть мета-агент и агент, который выполняет задачи. Мета-агент опирается на результаты выполнения задач и вносит изменения и в себя, и в агента-работника одновременно. Гиперагентов можно использовать с разными моделями: Claude-4.5-sonnet, O4-mini, GPT-4o 🌸Почему это работает: Абляционные исследования Как должна выглядеть оптимальная система агента, чтобы поощрять открыты поиск новых модификаций? Как правило, в предыдущих работах, если агенту и позволяется что-то модицифировать, то только в определнных рамках и заданных примитивах. Мы проверили, что будет, если этого избежать: результирующая система — Гиперагенты — оптимизирована под более быстрый поиск новых модификаций — и in-context обучение более эффективному самооулучшению. Модель в рамках итераций (их может быть хоть 200) начинает лучше понимать, какие изменения стоит вносить. Итак, что мы сравниваем: — HyperAgents (DGM-H): метаагент улучшает сам себя и агента-работника в многозадачной среде — HyperAgents без самомодификации: метаагент улучшает только агента работника в многозадачной среде, себя оставляет как есть — HyperAgents без архива предыдущих решений и их результатов: метаагент вносит улвчшения в себя и агента-работника, не опираясь на предыдущие результаты — Классика, DGM: метаагент изолированно улучшает агента-работника, на всех задачах и кастомно по одной задаче. 🟣HyperAgents (DGM-H) демонстрирует более динамичный рост общего перформанса на всех задачах — плюс, улучшения, полученные таким способам на одних доменах, переносятся в улучшения на других. 🌸Учимся самоулучшаться Мы вводим новую метрику, чтобы определить способность мета-агента вносит успешные улучшения: imp@50 (по аналогии с pass@50) 🟣Именно в рамках итеративного процесса самоулучшения у мета-агента в конце эксперимента существенно вырастает imp@50 в сравнении со стартовым состоянием (0 --> 0.63). 🟣Агент обрастает тулзами для поддержания памяти, трекинга изменений, отслеживания тенденций в результатах. 🟣Arxiv https://arxiv.org/abs/2603.19461 🟣Github https://github.com/facebookresearch/HyperAgents 🟣HF papers: https://huggingface.co/papers/2603.19461 🟣AlphArxiv https://www.alphaxiv.org/abs/2603.19461

🧵 Хочешь делать видео с нейросетями, но нет $300+ на пак нейронок в месяц?Есть рабочий лайфхак! Veo2, FramePack, Runway — звучит круто, но что делать, если ты студент с дохлым ноутом и нулём на карте? Я нашёл выход для тех, кто сейчас не может себе позволить платные нейросетки. 🎒 Мне всё чаще пишут: — Где генеришь? — Какой сервис юзать вместо Runway? — Как попасть на Veo 2? — Блин чёт дорого, а есть за бесплатно? И вот что я говорю всем: 💸 Платные инструменты — лучше. У них крутое качество, настройка, скорость. Я сам за сервисы, если есть возможность. Но если её нет... 🧬Тогда смотрим на Wan 2.1 Plus. Это не замена платным нейросетям. Это — вынужденный, но рабочий вариант. Что умеет: 🦾 Бесконечные кредиты генераций 🦾 Хорошая физика объектов 🦾 Можно вставлять референсы 🦾 Дают временный доступ к редким фичам (смешивание кадров) Минусы 🕐 Долгая генерация (больше 40 мин...) #opensource | AcidCrunch

Hashtags

Qwen выкатил интересную модель, которая разбивает обычные картинки на слои – как принято в этом вашем фотошопе Мда теперь нужно думать как эту тему вкорячить к себе в продукт) Вот тут детали, тут демо, модель уже в опенсорсе #qwen| AcidCrunch

Hashtags

ForgetMe | Нейросети

@forgetmeai · Post #5879 · 04.03.2026, 14:26

✴️В Qwen встряска: техлид Junyang Lin объявил об уходе сразу после релиза Qwen 3.5 Вокруг Qwen (Alibaba) разгорается история с неприятным послевкусием: Junyang Lin, которого называют техлидом и одним из ключевых лиц проекта, написал в X короткое «me stepping down. bye my beloved qwen» — без объяснения причин. Это случилось почти сразу после выхода Qwen 3.5 Small Model Series, из-за чего в комьюнити начались обсуждения, что произошло внутри команды. Дальше стало только громче: в ответах коллег появились намёки, что уход мог быть не совсем добровольным (возможные внутренние перестановки или политика после релиза). Параллельно СМИ пишут, что вслед за ним из Qwen ушли и другие заметные участники, включая руководителя пост-тренинга Yu Bowen, а ранее упоминался уход Hui Binyuan. При этом официального комментария Alibaba на момент публикаций не было. 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#qwen#новости

ForgetMe | Нейросети

@forgetmeai · Post #5777 · 26.01.2026, 17:03

✴️Вышла Qwen3-Max-Thinking — мощная модель frontier-уровня Qwen представили Qwen3-Max-Thinking, и по метрикам модель выглядит очень серьёзно Ключевые результаты бенчмарков: 🟡HLE 30.2 — примерно уровень Claude Opus 4.5, а с test-time-scaling обещают ещё выше 🟡SWE Verified 75.3 — немного ниже Opus, но на уровне Gemini 3 Pro 🟡IMO 83.9 — обходит Gemini 3 Pro, сильный результат по сложному рассуждению Помимо цифр, заявлены улучшенный tool calling и стабильное следование инструкциям, даже при работе с длинным контекстом. Попробовать модель: https://chat.qwen.ai/ 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5735 · 02.01.2026, 13:31

✴️Qwen-Image-2512: декабрьский апгрейд с упором на реализм и текст Команда Qwen подвезла праздничное обновление Qwen-Image-2512 — свежую версию декабрём, как раз к Новому году. Модель нацелена на более «живые» картинки и аккуратную работу с буквами в кадре, оставаясь в открытом доступе. Что улучшили: 🟡Люди выглядят естественнее. Ушёл характерный «ИИ-блеск», появились более детальные лица и мимика. 🟡Природа и материалы стали фактурнее. Трава, вода, шерсть и поверхности прорисовываются заметно резче. 🟡Текст в изображении — ровнее и точнее. Компоновка и попадание в макет стали предсказуемее, меньше артефактов. По итогам 10 000+ слепых сравнений на AI Arena модель заняла позицию сильнейшей среди open-source решений и уверенно держится рядом с закрытыми системами по качеству. Попробовать и скачать: 🟡Qwen Chat (t2i) 🟡Hugging Face — модель • Демо 🟡ModelScope — модель • Демо 🟡GitHub — репозиторий • Блог-анонс 🟡API (ModelStudio) 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen

ForgetMe | Нейросети

@forgetmeai · Post #5657 · 28.11.2025, 18:26

📛Новая модель генерации изображений от китайцев Вчера одна китайская лаборатория под покровительством Алибабы (qwen, wan и тд) представили Z-Image-Turbo (да она реально так называется). Качество генерации очень неплохое, но пока не выкатили версию под редактирование, но зато нет цензуры, подробнее: Линейка состоит из трёх вариантов (база — 6B), причём Turbo уже доступен и акцентирован на скорости и эффективности, а Base и Edit заявлены «скоро». 🟡Z-Image-Turbo (дистиллированная) — ~8 NFEs, субсекундная задержка на H800-классе, 16 ГБ VRAM достаточно; сильна в фотореализме, следовании промптам и двуязычном тексте. 🟡Z-Image-Base — недистиллированная версия для дообучения и кастомизации сообществом (скоро). 🟡Z-Image-Edit — специализация на редактировании (в т.ч. img2img по текстовым промптам, скоро). Где попробовать и почитать:Hugging Face: Z-Image-Turbo • Demo (HF Spaces) • GitHub (код и доки) • Comfy Workflow 🤑ForgetMe | Boosty Приобрести подписку на любые сервисы ⏩@forgetshop_bot #нейросети#новости#qwen