TGINSIGHT CHAT
DevOps
@DevOPSitsec
TechnologiesПо всем вопросам- @workakkk @itchannels_telegram - 🔥полезные ит-каналы https://t.me/Golang_google - Golang программирование @golangl - golang chat @GolangJobsit - golang channel jobs @golang_jobsgo - jobs РКН: clck.ru/3FmvZA #VRHSZ
Recent posts
Tag: #ai · 31 posts
Posted Apr 11
🔥 История, которая перевернула безопасность во всём мире и всё из-за одной «невидимой» ошибки В 1979 году на АЭС Three Mile Island в США произошла одна из самых известных ядерных аварий. Но самое страшное было не в поломке. А в том, как люди её интерпретировали. Операторы видели данные с приборов и сделали, казалось бы, логичный вывод: 👉 система переполнена водой 👉 нужно её уменьшить Они действовали «по инструкции». Но реальность была противоположной. 💥 Реальная проблема: • реактор терял охлаждение А действия операторов только усугубили ситуацию Почему это произошло? Потому что они опирались только на видимые сигналы, игнорируя то, чего не было видно напрямую. 🧠 Это тот же тип ошибки мышления, что и у Вальда: **мы доверяем тому, что видим и игнорируем то, чего не видим** После аварии провели масштабное расследование. И выяснилось: - интерфейсы показывали слишком много лишнего - ключевые сигналы были «спрятаны» - операторы не понимали, что действительно важно ⚡️ Что изменилось после этого: - появилось направление human-centered design в критических системах - интерфейсы начали проектировать под стрессовые ситуации - в авиации и энергетике внедрили симуляторы аварий - появилась концепция: 👉 «если пользователь ошибается — виноват дизайн, а не пользователь» 📊 Интересный факт: после внедрения новых подходов к интерфейсам и обучению 👉 количество критических ошибок операторов в авиации и энергетике снизилось в разы 💡 Где это встречается сегодня: - дашборды в аналитике - мониторинг в DevOps - алерты в продакшене - метрики в AI Ты видишь график — и думаешь, что понимаешь систему. Но настоящая проблема часто скрыта в том, чего нет на графике 👉 Главный вывод: самые опасные ошибки — не в данных а в том, как ты их интерпретируешь 📌 Параллель с Вальдом: - там не было данных о погибших самолётах - здесь не было понимания реального состояния реактора И в обоих случаях: невидимое оказалось важнее видимого #thinking#engineering#ai#devops
Hashtags
Posted Mar 25
📌Google разработала алгоритм квантования KV-кэша без потери точности. Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом. TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026. KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти. Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие. 🟡TurboQuant - двухэтапный пайплайн. Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны. На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score. Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных". Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral. При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация. Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами. Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет. 🟡Статья 🟡Arxiv @ai_machinelearning_big_data 🎯Полезные Мл-ресурсы🚀Max #AI#ML#LLM#TurboQuant#Google
Hashtags
Posted Mar 19
💀 Эта ошибка убила тысячи — и ты совершаешь её каждый день Во время Второй мировой войны аналитики ВВС США изучали повреждения бомбардировщиков, вернувшихся с миссий. Они отмечали, куда чаще всего попадали пули: - крылья - хвост - фюзеляж Вывод казался очевидным: 👉 усиливаем броню там, где больше всего попаданий Но один человек сказал: «Вы делаете всё наоборот» Его звали Абрахам Вальд — молодой статистик. И он увидел то, что остальные игнорировали. 💥 Главная мысль, которая всё изменила: Вы анализируете только выживших. А где данные о самолётах, которые не вернулись? Именно их и не хватает. Вальд сделал гениально простой вывод: 👉 если самолёт вернулся с дырками в крыльях — значит, туда *можно* попадать и выжить 👉 а вот туда, где дырок нет — попадание, скорее всего, фатально То есть: - двигатель - кабина пилота - топливная система — это и есть настоящие слабые места. Просто мы их не видим. Потому что такие самолёты не возвращаются. ⚡️ Армия изменила стратегию. Усилили не «самые пробитые места», а самые незаметные. Результат — тысячи спасённых жизней. 🧠 Так появилась концепция: ошибка выжившего (survivorship bias) Когда мы делаем выводы только по тем, кто «дошёл до финала» — и игнорируем всех, кто не дошёл. 📊 Интересные факты: - Вальд работал в секретной группе Statistical Research Group - Его подход применяли в авиации, баллистике и логистике - Он делал выводы из отсутствующих данных, а не только из имеющихся 💡 Где это ломает мышление сегодня: - стартапы — «делай как Uber» - инвестиции — «копируй успешных» - карьера — «вот путь топ-разработчика» - AI — «смотри на лучшие кейсы» 👉 Самое опасное: мы учимся только на успехах и почти никогда — на невидимых провалах 📌 Вывод: самые важные данные — это те, которых у тебя нет И именно они часто определяют реальность. #thinking#ai#business#startup
Posted Mar 12
🌟ByteDance перезапустила DeerFlow. DeerFlow 2.0 - проект, переписанный с нуля, который не имеет ничего общего с первой версией. Там был фреймворк для глубокого ресерча, а здесь полноценный рантайм для агентов. 🟡В основе лежит связка LangGraph и LangChain. Главный агент получает задачу, разбивает ее на подзадачи и порождает суб-агентов на лету. Каждый из них работает в изолированном контексте: не видит данные других агентов и главного процесса. Суб-агенты запускаются параллельно, когда это возможно, и возвращают структурированные результаты, а главный агент собирает из них финальный вывод. Сессия живет в изолированном Docker-контейнере с полноценной файловой системой, главный агент и суб-агенты работают в ней совместно. Агент читает и пишет файлы, выполняет bash-команды, работает с изображениями. Между сессиями нет никакой взаимной путаницы. 🟡Навыки и инструменты Возможности агента определяются через Skills. Из коробки есть исследование, генерация отчетов, создание слайдов, веб-страниц, изображений и видео. Навыки загружаются по мере необходимости, только когда задача их требует. Это снижает нагрузку на контекстное окно и позволяет работать с моделями, чувствительными к расходу токенов. Инструменты - по той же логике: базовый набор (веб-поиск, fetch, работа с файлами, bash), плюс поддержка MCP-серверов и произвольных Python-функций. Все можно заменить или расширить. 🟡Память и контекст DeerFlow помнит пользователя между сессиями. Накапливается профиль: стиль письма, технический стек, повторяющиеся сценарии. Данные хранятся локально. Внутри длинной сессии система сама управляет контекстом: завершенные подзадачи суммируются, промежуточные результаты уходят на диск. Контекстное окно не раздувается. 🟡Интеграции Поддерживаются Telegram, Slack и Feishu. Из Claude Code можно взаимодействовать с запущенным инстансом DeerFlow напрямую через специальный skill: отправлять задачи, управлять тредами и выбирать режим выполнения. 🟡Модели и деплой Система работает с любой моделью через OpenAI API, включая локальные через Ollama. ByteDance рекомендует использовать модели, которые поддерживают длинный контекст (100k+ токенов), ризонинг, мультимодальность и надежный tool-use. DeerFlow также встраивается как Python-библиотека без запуска HTTP-сервисов: from src.client import DeerFlowClient client = DeerFlowClient() response = client.chat("Analyze this paper", thread_id="my-thread") 📌Лицензирование: MIT License. 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Agents#DeerFlow#ByteDance
Hashtags
Posted Feb 16
🤖 Десятки гуманоидных роботов G1 показали первое в мире полностью автономное групповое выступление в стиле кунг-фу. Быстрые и синхронные движения вывели возможности роботизированной моторики на новый уровень и установили сразу несколько мировых рекордов. Модель H2 также стала одной из главных звёзд шоу- робот появился на главной сцене в Пекине и на площадке в Иу в образе Царя Обезьян. В тяжёлых доспехах он «летал на облаке», роль которого исполняли четвероногие роботы-собаки B2W, и с высоты поздравлял зрителей с Китайским Новым годом. @ai_machinelearning_big_data #Unitree#ai#Ml#robots
Posted Nov 20
⚡️Команда Google Research представила технологию живого перевода речи в речь, которая позволяет говорить на одном языке и почти мгновенно слышать перевод на другом. Раньше процесс проходил через три этапа: распознавание речи, перевод текста и синтез новой речи, из-за чего задержка могла достигать десятков секунд. Исследователи оптимизировали весь конвейер, сделали обработку более устойчивой и сократили время реакции. Перевод звучит естественнее, меньше «подправляется» в реальном времени, а паузы стали значительно короче. Технология приближает момент, когда люди смогут свободно общаться, даже если не знают языка собеседника. https://research.google/blog/real-time-speech-to-speech-translation @ai_machinelearning_big_data #Google#AI#Translation#SpeechToSpeech#GoogleResearch
Posted Oct 23
Модель Llama-Embed-Nemotron-8B от NVIDIA вышла на 1-е место в рейтинге MMTEB — став лучшей открытой и переносимой моделью эмбеддингов в мире. Она установила новый стандарт в задачах поиска, реранжирования и семантического сходства более чем на 1000 языках, превзойдя решения Google GeminiEmbedding и Alibaba Qwen3-8B. Построенная на базе Llama-3.1-8B, модель обучалась на 16 млн пар “запрос-документ”, прошла инструкционно-ориентированный fine-tuning и использует модельное слияние (model merging) для объединения многоязычного поиска в единую систему. Это - большой шаг вперёд для open-source ИИ и многоязычных исследований. https://huggingface.co/nvidia/omni-embed-nemotron-3b #AI#NVIDIA#Llama#Embeddings#Multilingual#Retrieval#OpenSource#LLM#SemanticSearch#Nemotron#MMTEB#DeepLearning#AIResearch
Posted Oct 8
🐦X открыл исходники алгоритма "For You" Как работает лента рекомендаций в 7 шагах: 1️⃣Сырые данные (вход): - соцграф (кто кого фолловит), - вовлечённость (лайки, ретвиты, ответы, закладки), - данные о пользователе (клики, профиль, поведение). 2️⃣Feature Engineering: - GraphJet — граф твитов в реальном времени - SimClusters — объединение в коммьюнити ("AI Twitter", "NBA Twitter") - TwHIN — карта связей пользователь↔твит - RealGraph — сила связей - TweepCred — скоринг доверия - Trust & Safety сигналы 3️⃣Candidate Sourcing (Home Mixer): Разные миксеры (CR Mixer, UTEG, FRS) вытягивают твиты из разных пулов → больше разнообразия. 4️⃣Heavy Ranker (ML-модель): Нейросеть предсказывает, что вам зайдёт: лайки, ретвиты, ответы, время чтения. 5️⃣Фильтры и эвристики: - социальное доказательство - разнообразие авторов - блок спама/NSFW/мутов - баланс контента - защита от «замыливания» 6️⃣Микс: Рекламные твиты + рекомендации «кого фолловить» → в ленту. 7️⃣Что это значит для вас: - выбери нишу - пиши ценные посты - отвечай по делу в своей теме → вырастишь аудиторию и найдёшь людей/идеи для бизнеса. https://github.com/twitter/the-algorithm #Twitter#ForYou#AI#RecommenderSystems
Posted Oct 3
⚡️ Релиз Agent S3 - продвинутый агент для работы с компьютером, который приближается к человеческому уровню. Вместо того, чтобы усложнять одну модель, авторы запускают несколько агентов параллельно и затем выбирают лучший результат. Метод назвили **Behavior Best-of-N (bBoN). Как работает: - Каждый агент пробует решить задачу. - Его действия переводятся в поведенческий нарратив - короткое описание, что реально изменилось на экране. - Специальный судья сравнивает эти нарративы и выбирает лучший. Результаты: - GPT-5 с 10 параллельными агентами → 69.9% успеха - Для примера у GPT-5 Mini → 60.2% - Agent S3* набирает на +10% выше предыдущей SOTA 📄Paper: http://arxiv.org/abs/2510.02250 💻Code: http://github.com/simular-ai/Agent-S 📝Blog: http://simular.ai/articles/agent-s3 @ai_machinelearning_big_data #AI#Agents#AgentS3#OSWorld#SimularAI#LLM
Posted Sep 10
💰 OpenAI заключила гигантский контракт с Oracle на $300 млрд на облачные вычисления сроком примерно на 5 лет - сообщает Wall Street Journal. Это один из крупнейших договоров на облачные вычисления в истории. Расходы на инфраструктуру для ИИ продолжают расти рекордными темпами, несмотря на опасения «перегрева» рынка. ⚡ Масштаб сделки: - OpenAI потребуется 4,5 гигаватта мощности - это больше, чем две плотины Гувера, или электричество для 4 миллионов домов. - Oracle уже демонстрирует рост: акции компании подскочили, а Ларри Эллисон (глава Oracle) за сутки заработал $101 млрд и стал самым богатым человеком на планете, обогнав Илона Маска. Рынок ИИ-вычислений превращается в арену сделок планетарного масштаба — где стоимость инфраструктуры измеряется сотнями миллиардов долларов и требует энергопотребления на уровне целых стран. 🟢Подробнее: wsj .com/business/openai-oracle-sign-300-billion-computing-deal-among-biggest-in-history-ff27c8fe @ai_machinelearning_big_data #AI#Cloud#OpenAI#Oracle#DataCenters
Posted Aug 28
📌Andreessen Horowitz выпустили пятый рейтинг TOP 100 ИИ-приложений. Главный вывод из пятого ежегодного списка Top 100 AI Apps — экосистема ИИ начинает приходить в равновесие. В веб-рейтинге появилось всего 11 новых имен, что заметно меньше, чем было мартовском отчете. В мобильном сегменте, напротив, новичков больше — целых 14, но это связано с тем, что App Store активно вычищают "клонов ChatGPT", освобождая место для оригинальных приложений. 🟡Главным событием стало укрепление позиций Google. Их флагманский ассистент Gemini занял 2 место после ChatGPT и в вебе, и на мобильных устройствах. Правда, разрыв пока существенный: в вебе Gemini набирает примерно 12% от трафика ChatGPT. А вот на мобильных платформах ситуация иная - у Gemini уже почти половина ежемесячно активных пользователей ChatGPT. Интересная деталь: почти 90% мобильной аудитории Gemini сидит на Android, тогда как у ChatGPT доля Android-пользователей составляет 60%. Помимо Gemini, в топ-10 ворвался Google AI Studio. Следом идeт NotebookLM на 13-м месте, а экспериментальная площадка Google Labs заняла 39-ю строчку, получив в мае 2025 года прирост трафика более чем на 13% после запуска видеомодели Veo 3. 🟡В общей битве ChatGPT все еще лидирует. Grok занял четвeртое место в вебе и 23-е на мобильных. Его мобильный рост особенно впечатляет: с нуля в конце 2024 года до более чем 20 миллионов MAU сейчас. В июле 2025 года, после релиза модели Grok 4, использование приложения подскочило почти на 40%. У Марка Цукербкрга успехи скромнее: 46-е место в вебе и полное отсутствие в мобильном топе. Perplexity продолжает уверенно расти, а вот Claude и DeepSeek показывают смешанные результаты. DeepSeek особенно сильно просел в вебе, потеряв более 40% трафика со своего пика в феврале 2025 года. 🟡Отдельного внимания заслуживает Китай. Сразу 3 компании, ориентированные на внутренний рынок, вошли в топ-20 веб-рейтинга: Quark от Alibaba (№9), Doubao от Bytedance (№12) и Kimi от Moonshot AI (№17). Более 75% их трафика приходится на Китай, где доступ к ChatGPT или Claude ограничен. Ещё более поразительна картина на мобильных устройствах. По оценкам, 22 из 50 приложений в топе были разработаны в Китае, но используются преимущественно за его пределами. Особенно сильна их концентрация в категории "фото и видео": одна только компания Meitu представлена 5-ю продуктами, включая BeautyPlus и Wink. Bytedance также не отстаёт с ассистентами Doubao и Cici. 🟡Ветераны рейтинга — 14 компаний, которые попадали в каждый из 5 списков Top 100 AI Apps. Это ChatGPT, Civitai, Poe, Perplexity, LeonardoAI, VEED, Gamma, QuiliBot, CutOut, Character AI, Midjourney, Photoroom, Eleven Labs и HuggingFace. Из этой "звёздной" команды только 5 компаний разрабатывают собственные модели, 7 используют сторонние API или опенсорс-решения, а 2 являются агрегаторами моделей. @ai_machinelearning_big_data #news#ai#ml
Posted Aug 11
📌Новый прорыв в алгоритмах: найден способ считать кратчайшие пути быстрее Дейкстры Метод преодоления "барьера сортировки" для задач кратчайшего пути в ориентированных графах. Группа исследователей из университетов Синьхуа, Стенфорда и Института Макса Планика представили детерминированный алгоритм для решения задачи SSSP в ориентированных графах с неотрицательными вещественными весами, который работает за время, пропорциональное числу ребер, умноженному на логарифмический множитель, который растет медленнее, чем обычный логарифм. Проблема поиска кратчайшего пути от одной вершины до всех остальных (SSSP) — одна из фундаментальных в теории графов, и её история тянется с 50-х годов прошлого века. Классический алгоритм Дейкстры, в связке с продвинутыми структурами данных, решает эту задачу за время, которое примерно пропорционально сумме числа рёбер и произведения числа вершин на логарифм от их же числа. Именно этот множитель - число вершин, умноженное на логарифм, долгое время считался теоретическим минимумом, так как в своей основе алгоритм Дейкстры побочно сортирует вершины по расстоянию от источника. Этот предел известен как «барьер сортировки» и казался непреодолимым. 🟡Основная идея работы - гибрид из алгоритма Дейкстры и алгоритма Беллмана-Форда. Алгоритм Дейкстры на каждом шаге выбирает из "границы" - множества еще не обработанных вершин ту, что находится ближе всего к источнику. Это и создает узкое место, так как размер границы может достигать величины, сопоставимой с общим числом вершин в графе, и на каждом шаге требуется находить минимум. Алгоритм Беллмана-Форда, в свою очередь, не требует сортировки, но его сложность пропорциональна числу ребер, умноженному на количество шагов, что слишком долго. 🟡Новый подход использует рекурсию. Вместо того чтобы поддерживать полную отсортированную границу, алгоритм фокусируется на ее сокращении. А если граница слишком велика, то запускается несколько шагов алгоритма Беллмана-Форда из ее вершин. Это позволяет найти точное расстояние до некоторой части вершин, чьи кратчайшие пути коротки. Длинные же пути должны проходить через одну из "опорных" вершин, которых оказывается значительно меньше, чем вершин в исходной границе. Таким образом, сложная работа концентрируется только на этом небольшом наборе опорных точек. 🟡Принцип "разделяй и властвуй". Он рекурсивно разбивает задачу на несколько уровней. На каждом уровне применяется вышеописанная техника сокращения границы, что позволяет значительно уменьшить объем работы на каждую вершину, поскольку логарифмический множитель эффективно делится на другой, более медленно растущий логарифмический член. В итоге, путем подбора внутренних параметров алгоритма, которые являются специфическими функциями от логарифма числа вершин, и достигается итоговая временная сложность, пропорциональная числу ребер, умноженному на этот новый, более медленно растущий логарифмический множитель. ✔️ Зачем это нужно — Быстрее решаются задачи в навигации, графах дорог, сетях и планировании. — Доказано, что Дейкстра — не предел, и можно ещё ускорять поиск кратчайших путей. 🟡Arxiv @ai_machinelearning_big_data #AI#ML#Sorting#Graphs#Algorithm
Hashtags