TGTGInsighttelegram intelligenceLIVE / telegram public index
← Midjourney/Nano Banana Prompts NeuroSpark

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @Shutter · Post #4607 · 22 mai

Harbor, cargo port, ships #AI#artificial_Intelligence

Résultats

10,064 posts similaires trouvés

Recherche globale générale

Machinelearning

@ai_machinelearning_big_data · Post #9447 · 29/01/2026 16:04

🌟Step3-VL-10B: VLM от stepfun.ai. Пока индустрия одержима гигантоманией и соревнуется, у кого больше параметров, Stepfun решили пойти против течения. Встречайте, Step3-VL-10B - компактная VL-модель, которая по заявлениям разработчиков не просто конкурирует, а буквально уделывает модели в 10–20 раз тяжелее, включая таких титанов, как Gemini 2.5 Pro и GLM-4.6V. Звучит как маркетинговый хайп, но под капотом есть интересные инженерные решения, хоть и с хитринкой. 🟡Архитектура Конструкция из кастомного визуального PE-lang энкодера на 1.8B параметров и Qwen3-8B (что уже половина успеха, учитывая мощь Qwen) в качестве декодера. В отличие от многих, кто замораживает визуальную часть, Stepfun разморозили все и тренировали модель в один прогон на 1,2 трлн. токенов. Это позволило визуальной и языковой частям модели не просто сосуществовать, а реально срастись и притереться друг к другу. После этого модель прогнали через адский RL-цикл (RLVR+RLHF) на 1400+ итераций, чтобы модель научилась жестко ризонить. 🟡Тесты В бенчмарках цифры действительно страшные (в хорошем смысле) для такого размера: 🟢MMMU: 78.11 (SeRe) / 80.11 (PaCoRe). 🟢MathVista: 83.97 🟢AIME 2025: 87.66 (SeRe) / 94.43 (PaCoRe) 🟢OCRBench: 86.75 (отлично читает документы). Для сравнения: GLM-4.6V на 106B выдает на MMMU только 75.20. Инженерная хитринка кроется в методологии тестирования. Видите в результатах тестов пометку PaCoRe? PaCoRe (Parallel Coordinated Reasoning): Чтобы получить топовые цифры, модель использует test-time compute. Она запускает 16 параллельных роллаутов, собирает доказательства из разных веток и синтезирует ответ. На инференсе это будет стоить вам в 16 раз "дороже" по ресурсам, чем обычный прогон. В стандартном режиме (SeRe) модель все еще хороша, но уже не выглядит как "убийца всех топов". Кстати, Stepfun честно признались, что в отчетах накосячили с бенчмарками конкурента Qwen3VL-8B из-за неверного max_tokens. Извинились, обещают пересчитать. Это добавляет доверия, но напоминает, что бенчмарки - дело тонкое. В общем, модель - отличный кандидат для локального использования: есть OpenAI-compatible API и vLLM поддерживается (PR вмержили). ⚠️ Если модель зацикливается при генерации - обновите конфиг, там был баг с eos_token_id, который уже пофиксили. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Arxiv 🟡Demo @ai_machinelearning_big_data #AI#ML#VLM#STEP3#StepFunAI

Machinelearning

@ai_machinelearning_big_data · Post #8105 · 21/07/2025 14:12

MWS Cloud включается в игру: запускает Data Lakehouse Пока все обсуждают, как внедрять LLM, в MWS Cloud сделали ход: вышли с собственной платформой для хранения и обработки больших данных — MWS Data Lakehouse. Это уже не просто база или витрина, это полноценный фундамент для обучения, инференса и аналитики. Ключевая особенность — универсальность. Платформа работает с любыми типами данных: структурированными, неструктурированными, векторными. Поддержка Apache Parquet, Iceberg, Greenplum, Postgres, запуск в Kubernetes, объектное S3-хранилище. Всё, что нужно, чтобы компания могла: обучать ML/LLM модели, строить BI-отчёты, прогнозировать, сегментировать, оптимизировать. И всё это без копирования данных между системами. Главное — цифры. Платформа ускоряет обработку данных в 23 раза. Хранилище используется на 40% экономичнее. В 2,5 раза выше эффективность ИТ-персонала. Витрины данных считаются в 2 раза быстрее. То есть платформа не просто "поддерживает ИИ" — она позволяет его внедрять в реальных бизнес-процессах, а не в пилотах и презентациях. Безопасность и масштабируемость. Встроенные инструменты шифрования, маскирования, аудита, контроль доступа. Централизованное управление, масштабирование без простоев. Можно запускать кластеры под разные команды и сценарии параллельно — без дублирования данных. Контекст: рынок меняется. Компании всё активнее вкладываются в инструменты, которые позволяют работать с ИИ на проде, а не просто тестировать гипотезы. Lakehouse — архитектура, к которой уже перешли десятки тысяч компаний на Западе. MWS Cloud предлагает такую же модель — внутри российской облачной экосистемы. И да: MWS Data Lakehouse — часть экосистемы MWS Data, включающей 25+ сервисов для хранения, аналитики и AI. Почему это важно. ИИ уже давно не хобби айтишников. Это трансформация всей ИТ-архитектуры компаний. А без таких платформ запуск ИИ-проектов становится дорогим, медленным и уязвимым. Именно поэтому сейчас выигрывают не те, у кого «есть данные», а те, у кого есть инфраструктура, чтобы эти данные реально использовать. @ai_machinelearning_big_data #data#ai#ml#infrastructure#mts

Google Nano Banana вышла в релиз: обзор обновления Google объявила о выходе модели Gemini 2.5 Flash Image (известной как Nano Banana) в статус General Availability (GA). Это означает завершение тестовой фазы и переход к стабильной версии, готовой для промышленного использования. В обновлении основное внимание уделено повышению стабильности и производительности, а также добавлению новых функций: 🔹Ключевые нововведения: ➡️📐 Поддержка 10 форматов вывода: Теперь доступны все популярные соотношения сторон: · Ландшафтные: 21:9, 16:9, 4:3, 3:2 · Квадратные: 1:1 · Портретные: 9:16, 3:4, 2:3 · Гибкие: 5:4, 4:5 ➡️💎 Опция вывода только изображения: Для разработчиков добавлена возможность получать от модели только сгенерированное изображение без текстового описания, что позволяет сократить расход токенов при использовании API. 🛠️Основные возможности модели: ➡️Высокая согласованность персонажей между изображениями. ➡️Редактирование контента с помощью текстовых запросов. ➡️Функция слияния нескольких изображений в одну композицию. 💵Условия использования: Модель доступна в Gemini App, Google AI Studio и Vertex AI для корпоративных клиентов. Стоимость генерации одного изображения через API составляет $0,039. #NanoBanana#Gemini#GoogleAI#ИскусственныйИнтеллект#ГенерацияИзображений#AI https://t.me/semasci

Machinelearning

@ai_machinelearning_big_data · Post #8491 · 10/09/2025 11:01

🧠 ИИ генерирует научный код лучше людей. Сегодняшний дамп статей от Google Research — это не очередной инкрементальный апдейт, а знаковое событие. Исследователи представили систему, которая автоматически создаёт экспертное ПО для научных задач, и она уже побеждает на профессиональных лидербордах. Это не просто ещё один кодогенератор. Система использует LLM (Gemini), управляемую древовидным поиском (Tree Search) — алгоритмом из мира AlphaGo. Её цель — не просто скомпилировать код, а итеративно улучшать его, максимизируя конкретную метрику качества (score) на реальных данных. Учёные называют такие задачи «scorable tasks». ⚡ Что система сделала на практике: 1. Биоинформатика (scRNA-seq): Открыла 40 новых методов для интеграции данных single-cell, которые побили лучшие человеческие методы на публичном лидерборде OpenProblems. ИИ не просто скопировал известный метод BBKNN, а улучшил его, скомбинировав с другим алгоритмом (ComBat), до чего люди не додумались. 2. **Эпидемиология (COVID-19):** ИИ сгенерировал 14 моделей, которые в течение всего сезона 2024/25 стабильно показывали результаты лучше, чем ансамбль CDC и любые отдельные модели при прогнозировании госпитализаций. Работа с временными рядами обычно очень сложна, но здесь ИИ справился и превзошёл существующие подходы. 3. Другие области: Система также показала SOTA в: · Сегментации спутниковых снимков (DLRSD benchmark, mIoU > 0.80) · Прогнозировании нейронной активности целого мозга zebrafish (ZAPBench) · Прогнозах временных рядов (GIFT-Eval benchmark) · Численном решении сложных интегралов, где стандартная scipy.integrate.quad() падает. 🟠Как это работает? Вместо того чтобы с нуля генерировать код, система начинает с существующего решения (например, вызова quad() или простой модели) и запускает древовидный поиск. На каждом шаге LLM предлагает «мутации» — варианты изменения кода. Дерево поиска решает, какую ветку развивать дальше, балансируя между эксплуатацией (улучшение текущего лучшего решения) и исследованием (попытка радикально новых идей). Ключевая фишка — система умеет интегрировать научные идеи извне. Ей можно скормить PDF научной статьи, и она попытается реализовать описанный там метод. Более того, ИИ может комбинировать идеи из разных статей, создавая гибридные методы, которые и приводят к прорыву. 🟠Что это значит? Это не замена учёным. Это мощнейший инструмент усиления. Система за часы прорабатывает и тестирует идеи, на которые у исследовательской группы ушли бы недели или месяцы. Она без устали перебирает «иголки в стоге сена» — те самые нетривиальные решения, которые ведут к скачку в качестве. Пока что система требует чётко определённой метрики для максимизации. Но для огромного пласта эмпирической науки (от биологии и медицины до климатологии и астрофизики) это и есть основной способ оценки гипотез. Вывод: Это один из самых убедительных на сегодня шагов к реальному ИИ-ассистенту для учёных. Он не просто отвечает на вопросы — он проводит вычислительные эксперименты и находит решения, превосходящие человеческие. 🟢Оригинал статьи: An AI system to help scientists write expert-level empirical software 🟢Код и примеры решений:github.com/google-research/score @ai_machinelearning_big_data #AI#Science#MachineLearning#LLM#Research#GoogleAI

Machinelearning

@ai_machinelearning_big_data · Post #9105 · 27/11/2025 16:27

✔️INTELLECT-3 - новая мощная открытая модель от Prime Intellect Prime Intellect выкатили INTELLECT-3 - 106B Mixture-of-Experts модель, обученнfz на GLM-4.5 Air Base с двумя этапами: SFT и масштабным RL-дообучением. Это первая модель такого масштаба, где асинхронный RL - не эксперимент, а основа обучения. В результате модель демонстрирует сильный перформанс в математике, коде и reasoning. Фокус модели - долгие цепочки действий и агентные задачи, а не просто генерация текста. Главное: - Модель показывает топ-результаты для своего размера в математике, коде и reasoning. - Обучение шло на 512×H200 в течение ~2 месяцев. - Использован собственный стек: PRIME-RL, Verifiers, Environments Hub и sandbox-инфра. - Всё открыто: код, среды, инструменты. 🟠Technical Report:https://storage.googleapis.com/intellect-3-paper/INTELLECT_3_Technical_Report.pdf 🟠Hugging Face: https://huggingface.co/PrimeIntellect/INTELLECT-3 🟠PRIME-RL: https://github.com/PrimeIntellect-ai/prime-rl 🟠Verifiers: https://github.com/PrimeIntellect-ai/verifiers 🟠Environments Hub: https://hub.primeintellect.ai @ai_machinelearning_big_data #ai#intellect3#primeintellect#glm45

Метаверсошная

@olya_tashit · Post #3329 · 16/12/2024 07:02

Поглядываю, куда движется наш прости господи AI-powered метаверс. Сегодня пару слов про вклад компании Niantic - это ребята, которые делали покемон го (а потом оказалось, что они так нас заставляли собирать данные о физическом мире. Умно 😂) У Ниантика есть идея-фикс - оцифровать весь мир в 3D виде и перенести на карту. И для этого у них есть сервис Scaniverse (на iOS и Андроидах). Ставите, выбираете, как будете сканировать - обычным методом, известным как фотограмметрия, или методом gaussian splatting. Разница между первым и вторым в том, что первый дает на выходе капец какую тяжелую 3D модель из полигонов, а второй создает 3D сцену из "размытых пятен", которая описывается математической гауссовой функцией (не спрашивайте, я гуманитарий 😭) Короче, это быстрее и эффективнее. ИИ помогает эти пятна вычислять и улучшать. И считается, что это и есть наш путь к легкому и быстрому созданию 3D контента, примерно как сейчас мы снимаем видео. Хотя мне не нравится то, как GS модели выглядят сейчас - вблизи они выглядят как вермишель. Но со временем станет лучше. Так вот, Scaniverse. Я не особо стараясь отсканила Егора на балконе (Егор - это растение), телефон у меня уже староват для этих ИИ извращений (Pixel 6), а обработка скана происходит на устройстве. Так что он нагревался 20 минут, а потом выдал вот такой скан - ссылка. Также Ниантик выпустили сервис на шлемы Квест для просмотра всего этого великолепия в виаре. Сервис надо запускать, открыв браузер на квесте, и набрав ссылку intothescaniverse.com Егором полюбоваться у меня не получилось, потому что они еще не сделали авторизацию для андроида. Но чужие сканы и сам сервис мне понравились - записала видосик. Особенно эффект и звук открывания моделек, когда прыгаешь внутрь. Что-то такое из sci-fi фильмов про телепортацию. #AI#Niantic#GaussianSplatting#AIPoweredMetaverse

秀儿の科技软件|资源分享社🎀

@JianjiaoPD · Post #10356 · 25/01/2026 14:35

✈️ViNoter | 用对话把视频变成笔记、字幕、卡片和问答的一站式开源工具 🏷 检索标签:#ViNoter#视频笔记#AI#转录#笔记#翻译 ⭐️ 详情介绍:ViNoter 是一个对话式的视频处理智能体,你只需要用自然语言说一句需求,它就会把 搜视频→转录→整理成笔记或文章 这一整套流程跑完,适合经常靠视频学习、但又懒得手动整理的人,它最省心的地方在于 跨平台搜索(B站/YouTube)、本地视频也能直接喂,再加上基于 Faster-Whisper 的 高质量本地转录,不太像演示性质的 AI 玩具,而是能进工作流的那种 📖GitHub · ViNote 文档 😌频道 |🙂群聊 |😋中文包 |☺️搜索

AI & Law

@ai_and_law · Post #334 · 19/06/2024 07:04

Indiana Officer Resigns After Misusing Clearview AI An Indiana police officer has resigned after it was discovered he frequently misused Clearview AI’s facial recognition technology to track social media users not linked to any crimes. According to the Evansville Police Department, the officer disguised personal searches by using actual case numbers associated with real incidents. An audit revealed an unusual high usage of Clearview AI by the officer, who primarily searched social media images rather than live or CCTV footage typically used in investigations. The department recommended termination, but the officer resigned before a final determination could be made. This incident highlights significant concerns about the misuse of facial recognition technology and underscores the need for stricter oversight and compliance measures to prevent abuse. #AI#Privacy#FacialRecognition#ClearviewAI

Huawei Ascend 910D — новый удар по монополии NVIDIA Помните, как чип Ascend 910B от Huawei уже заставил нервничать рынки? Теперь история набирает обороты! Компания Huawei представилановый AI-чип Ascend 910D — ответ на жёсткие экспортные ограничения США. По данным The Wall Street Journal и Reuters, процессор создан, чтобы конкурировать с флагманом NVIDIA H100, а его производительность может даже превзойти американский аналог. Ключевая цель — обеспечить Китай локальными технологиями и снизить зависимость от западных решений. Почему это важно? 👉 Ранее я писал, что Ascend 910B (предыдущая версия) уже показал впечатляющие результаты: потеря всего 5% производительности при запуске ИИ DeepSeek, но экономия 70% на инференсе. 👉 Теперь 910D — следующий шаг. Если Huawei выполнит заявленные характеристики, давление на NVIDIA усилится: китайские компании массово перейдут на отечественные чипы. Что дальше? Китай делает ставку на технологический суверенитет, и Huawei — главный игрок в этой гонке. Если Ascend 910D подтвердит заявленный уровень, мировой рынок AI-чипов ждёт передел. NVIDIA придётся не просто конкурировать, а экстренно искать новые козыри. А вы верите в то, что Huawei способна обойти NVIDIA? https://t.me/semasci #Huawei#NVIDIA#GPU#AI#чипы#технологии

12•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••550•••600•••650•••682683684685686•••700•••750•••800•••838839