TGINSIGHT CHAT
🚀 Андрей Артищев
@startupandtech
ТехнологииЯ - Андрей Артищев. Я практик, который разрабатывает AI&ML продукты. В прошлом также создал 2 hardware продукта - гаджет для коррекции осанки «Мастер осанки», и мотошлем дополненной реальности Livemap Контакты @andrewartishchev
Последние посты
Стр. 46 из 84 · 1,000 постов
Опубликован 21 июл.
О конференции «Лето с AIRI» в Томске. Я всегда стремлюсь развиваться, читать и узнавать что-то новое, искать всевозможные пути роста. Регулярно посещаю конференции — иногда просто как слушатель, порой меня даже приглашают выступать, но я пока стеснялся принимать участие в качестве спикера. В этом году, в июле я участвовал онлайн в мероприятиях SMILE, (Сколтех и Альфа-Банк органзиторы), а также офлайн — в летней школе «Лето с AIRI» в Томске. Я был очень рад, что из 400 заявок на 80 мест, для участия в данной конференции выбрали также и меня. (Места на этой конференции не продаются, и можно попасть только по конкурсному отбору). По словам генерального директора AIRI, профессора РАН Ивана Оселедца, за четыре года проведения школы поступило более 2,5 тыс. заявок со всей России: от Москвы и Санкт-Петербурга до Приморского края. Молодые учёные из более чем 10 регионов России представили 28 собственных проектов в рамках летней школы по искусственному интеллекту «Лето с AIRI», завершившейся в Томске. Организаторы и участники Школа организована Институтом искусственного интеллекта AIRI и Томским государственным университетом при поддержке Cloud.ru. Томский государственный университет — один из старейших вузов России, основанный в 1878 году. Институт искусственного интеллекта AIRI — автономная некоммерческая организация, объединяющая исследователей и инженеров данных для прорывных исследований в области ИИ. Основные доклады и итоги конкурса • Победитель конкурса — социально-ориентированный проект по анализу изображений домашних питомцев. • Второе и третье места поделили работы по исследованию агентов с памятью в обучении с подкреплением. • Кейс третьего места — восстановление SMILES-записей молекул из данных конформаций в трёхмерном пространстве. Я прилетел в Томск для участия в интенсивной научной и проектной программе: слушал доклады по ключевым темам, особенно по архитектурам и агентам для LLM (что напрямую релевантно нашим задачам). Больше всего мне понравились секции по агентам и памяти для моделей — именно эти идеи я планирую применять в работе нашего отдела. Ниже — все названия занятий из программы, посвящённые именно агентным архитектурам и разработке MVP-решений (frontend и backend) : • «Мультиагентные системы и ризонинг» • «Эволюция мышления LLM-агентов: от базовой логики до научных открытий» • «Мультиагентные системы: современные архитектуры и методы взаимодействия агентов» • «Агенты с памятью в обучении с подкреплением» • «LLM как агенты: фундамент и механизмы взаимодействия» • «Введение в LLM-агенты и область их применения» • «Координация и роли в мультиагентных системах на базе LLM» • «Архитектура и инструменты LLM-агентов» • «Практические инструменты: от самописных агентов до LangChain и AutoGen» • «Расширение функционала и устойчивости LLM-агентов» • «Практика внедрения и сопровождения LLM-агентов» • «Разработка MVP: backend» • «Разработка MVP: frontend» 1-ый Проект что я делал на конференции «Memory is a Tool» Цель и суть проекта В числе проектных треков я выбрал направление, связанное с построением памяти для мыслительных агентов — чтобы хранить, структурировать и подмешивать персональные и контекстные данные в модель (применимо, например, для Shop&Drive). Наш проект «Memory is a Tool» реализует мультиуровневую память для LLM, похожую на MemGPT (core, FIFO, archive) с in-prompt памятью и возможностью восстанавливать данные из долгой истории диалога. Отличие от RAG В отличие от RAG, где система выполняет поиск и встраивает релевантные фрагменты каждого раза, «Memory is a Tool for LLM» создаёт постоянно растущую память, позволяющую модели «помнить» ключевые детали, а не каждый раз их запрашивать. Польза для Shop&Drive MemGPT-подобная память даёт ассистенту возможность вести длинные сессии без потери контекста: система запоминает историю покупок и предпочтения клиента, даже если между чатами проходит время. Клиенту не нужно повторять желаемые товары — ассистент сам «вспоминает» прошлые заказы и делает проактивные рекомендации.
Опубликован 21 июл.
RAG для человека... В эссе «Augmenting Long-term Memory» (июль 2018) Майкл Нильсен описывает, как современные персональные системы памяти (в частности, Anki) позволяют структурировать, хранить и «доставать» нужную информацию почти так же эффективно, как компьютерные RAG-системы делают это с данными . Автор проводит читателя через исторические эксперименты по изучению выдающихся памяти людей, идею «механического расширителя памяти» (memex), а затем подробно рассказывает о личном опыте применения Anki и о правилах, позволяющих превратить память в выбор, а не в случайность . Исторические корни и концепция RAG для человека Соломон Шерешевский и безграничная память В 1920-х психолог Александр Лурия изучал Соломона Шерешевского, который запоминал любые строки цифр и слов даже спустя годы после тестов . Эти исследования показали, что человеческая память обладает огромным потенциалом, но требует механизма вспомогательного «хранилища» для систематизации знаний. Memex и эволюция представлений о памяти Ванневар Буш в 1945 году предложил концепцию memex — устройства для хранения книг, записей и коммуникаций с возможностью быстрого выбора и навигации по ним . Эта идея вдохновила Дугласа Энгельбарта на разработку «augmentation of human intellect» и Теда Нельсона на гипертекстовые системы, а позже и Тим Бернерса-Ли на создание веба как коллективной памяти организаций . Anki как инструмент RAG Принцип работы Anki Anki — это не просто цифровая система карточек, а система интервальных повторений: при правильном ответе интервалы между повторениями удваиваются, а при ошибке — сбрасываются, что позволяет оптимизировать усилия по запоминанию . Эффективность и экономия времени Нильсен оценивает, что без интервальных повторений запоминание на 20 лет потребовало бы более 2 часов повторений на каждую единицу факта, тогда как с Anki — всего 4–7 минут за счёт экспоненциального роста интервалов . Это даёт более чем 20-кратную экономию времени и превращает память в управляемый ресурс. Почему это RAG для человека Сбор и хранение («retrieval») Как и RAG-системы обращаются к внешним базам знаний, пользователь Anki создаёт обширную базу карточек и «доставляет» нужное знание в момент запроса . Генерация и творчество («augmented generation») Интервальное повторение не просто напоминает данные, но и формирует глубокие ассоциативные связи, позволяя применять запомненные факты творчески и оперативно в решении задач . Практические применения • Профессиональное развитие: учёба по статьям и книгам, подготовка к конференциям и публикациям . • Личная жизнь: запоминание фактов о семье, путешествиях, хобби — всё, что важно, но легко забывается без систематического повторения . Статья Майкла Нильсена демонстрирует, что человеческая память при помощи правильных инструментов и техник превращается в мощную RAG-систему: внешние карточки Anki выступают в роли «базы знаний», а механизм интервальных повторений обеспечивает своевременную «доставку» информации и укрепление когнитивных связей. Таким образом, мы получаем не только запоминание фактов, но и расширенные возможности для генерации новых идей и решений. https://augmentingcognition.com/ltm.html
Опубликован 20 июл.
Создатель игровой компании Valve с капитализацией $10+ миллиардов долларов Гейб Ньюэлл (Gabe Newell) дал интервью, в котором утверждает, что лучшими программистами в эпоху ИИ будут те, кто вообще не умеет программировать, но хорошо ставит задачи на разработку кода. Сами программисты скорее будут тянуть с собой устаревшие технологии и практики, а сам ИИ как кодер и даже архитектор будет сильнее их. https://youtu.be/aCgxGfVM_d0
Опубликован 20 июл.
Как использовать mcp context 7
Опубликован 20 июл.
Как ChatGPT помог мне с Claude Code: Tortoise, Dramatiq, Loguru, Instrumentator, Traefik В последние недели не раз натыкался на глюки и галлюцинации в коде, который генерировал Claude Code. Ломались сборки, падали миграции, баги в логике задач, а мониторинг вообще не работал — из-за слишком громоздкого стека графиков и настроек. Чтобы проект реально «вывозил» задачи, а не «бредил», я решил провести полный аудит тех стека, используя ChatGPT (модель 04-mini-high) как вспомогательного ревьюера. Почему старый стек мешал Claude Code • SQLAlchemy + Alembic создавали десятки строк boilerplate для каждой модели и миграции, что усложняло автогенерацию и порождало конфликты схем. • Celery с его бесчисленными настройками брокеров, prefetch, chains и chords приводил к путанице и странным зависаниям при прогоне задач. • Prometheus + OpenTelemetry требовали километровых конфигов, и Claude постоянно «терялся» в настройках экспортеров и метров. • Nginx как прокси добавлял лишний уровень абстракции: приходилось править конфиги, перезагружать контейнеры и вручную собирать сертификаты — не тот уровень автоматизации, от которого ждёшь от AI-агента. ⸻ Что поменял ChatGpt по результатам аудита 1. ORM и миграции • Было: SQLAlchemy + Alembic • Стало: Tortoise ORM + Aerich • Синхронный, понятный API, похожий на Django ORM. • Полностью асинхронная работа без лишнего кода. • Aerich обеспечивает простые команды init-db, migrate, upgrade. 2. Фоновые очереди задач • Было: Celery + Redis • Стало: Dramatiq + Redis • В 3× быстрее в бенчмарках на 20 000 задач. • Простые декораторы @dramatiq.actor, sane-defaults (retry, rate-limit). • Минимум конфигурации и максимум надёжности. 3. Логирование • Используем: Loguru • Мгновенно готовый к работе logger без boilerplate. • Цветной и структурированный вывод, встроенная ротация и retention. • Однорядковая настройка enqueue=True для безопасной работы в async/мультипроцессах. 4. Метрики • Используем: prometheus-fastapi-instrumentator • Однострочная интеграция: Instrumentator().instrument(app).expose(app) Автоматически получаем метрики HTTP-запросов и длительности без громоздких OpenTelemetry-конфигов. 5. Обратный прокси • Было: Nginx • Стало: Traefik • Авто-обнаружение Docker-сервисов по меткам (labels). • Встроенный ACME (Let’s Encrypt) без доп. скриптов. • Минимум “воды” в настройках — максимум динамики и автоматизации. Итог • Boilerplate ↓ 50 % → меньше шаблонного кода и ошибок при миграциях. • Задачи ↑ 3× → Dramatiq предотвратит таймауты и зависания. • Логирование ↑ 2× → стабильно “быстрое” и безопасное. • Метрики ↓ > 90 % конфига → мгновенная готовность к сбору метрик. • Прокси ↓ 60 % сложностей → динамическое обнаружение сервисов и автоматический SSL. Такой стек позволит Claude Code сконцентрироваться на бизнес-логике, а не на рутинных настройках и «ловушках» конфигов.
Опубликован 20 июл.
🔥 Dream → Teamlead — практическая онлайн+офлайн‑конференция от Яндекса для тимлидов, где минимум скучных слайдов и максимум живого опыта и интерактива 🎯 Зачем смотреть: • Готовые инструменты по лидерству и развитию команд от топ-экспертов • Тайм-менеджмент, мотивация и стрессоустойчивость — реальные кейсы и лайфхаки Смотрю сейчас сам и Вам рекомендую https://www.youtube.com/live/ZKqbyZUhnWk
Опубликован 19 июл.
С конференции team-lead conf сегодня в Яндекс
Опубликован 19 июл.
🚙 Супертест семи электрокаров: настоящий запас хода в России Хотите реальных цифр? В поездке на 320 км вокруг Подмосковья протестировали сразу семь моделей — от локализованных Evolute i‑Joy, «Москвич 3е», Ora 03 до премиальных Hongqi E‑HS9, Avatr 11, Nio ES8 и Tesla Model 3 Long Range. Результаты удивляют — у одних запас хода оказался ниже паспортного, у других подтвердился или даже превзошёл ожидания. Тест проходил в обычных условиях: с включённой музыкой, отоплением, без экономрежимов — всё как в реальной жизни. https://auto.ru/mag/article/vyyasnyaem-realnyy-zapas-hoda-semi-elektrokarov/
Опубликован 19 июл.
🚗 Xiaomi YU7: на тесте не 700 км, но результат все равно достойный! Наткнулся на новость про новый электрокроссовер Xiaomi YU7. Производитель заявлял аж 700 км на одном заряде — звучит круто, но в независимом тесте получилось 463 км. Да, меньше, чем обещали, но на самом деле это совсем не провал, а нормальный, даже хороший показатель для современного электрокара. Маршрут представлял собой 84-километровое шоссейное кольцо, по которому кроссовер двигался со средней скоростью 99,6 км/ч с двумя пассажирами и фототехникой, имитируя половинную загрузку. YU7 Max проехал 483 км до отображения нулевого заряда и ещё 9 км на резерве, что составило 65,5% от заявленного пробега. Тест зарядки показал, что батарея полностью заряжается за 37 минут, поддерживая стабильную мощность 300 кВт на отрезке 5–70% заряда, со средней мощностью 176,3 кВт. Расход энергии составил 22,1 кВт⋅ч/100 км, превысив расчётный показатель 20,6 кВт⋅ч/100 км. Что интересно: мой “старичок” Mazda CX-5 2017 года с 2.5-литровым бензиновым мотором проезжает примерно столько же на полном баке. Так что в плане запаса хода Xiaomi YU7 уже ничем не уступает привычным бензиновым авто. В городе — разницы вообще не почувствуешь. И главное: для электромобиля почти 500 км без подзарядки — это реально достойно! Большинству людей такого пробега хватает с головой на неделю-другую обычных поездок по городу и даче. А если вспомнить, как быстро развивается электроника, уверен, что следующие поколения “китайцев” уже спокойно перепрыгнут и эту планку. В общем, никаких разочарований — просто подтверждение того, что современные электрокары уже реально догоняют классические машины по практичности. А мой CX-5 — отличный ориентир: если новая электричка может ехать столько же, значит, прогресс не стоит на месте! Что думаете, насколько для вас важен запас хода? Уже готовы пересесть на электрокар или пока рано?
Опубликован 18 июл.
Обзор "MCP для новичков" Пожалуй это первая публикация на Хабр в которой просто и понятно, без маркетингового булщита и воды, автор разобрался сам и попытался объяснить нам, что такое MCP (Model Context Protocol), зачем он нужен, почему он работает так как работает и какие у него особенности. Тезис, вокруг которого построена публикация: Model Context Protocol (MCP) - это просто API, разработанный для LLM. Я тоже придерживаюсь мнения, что MCP это такое хитрое API с полезными утилитами созданными для того чтобы LLM эффективнее решала поставленные задачи, точка, попытки прикрутить к MCP что-то более как правило оканчиваются разочарованием в MCP. Тут просто нужно понять и принять тот факт, что инструмент этот создан под определённую задачу, например молотком стоит забивать гвозди, а не пытаться рубить дерево, MCP нужен далеко не всегда, иногда проще реализовать классическое REST API. Рекомендую к прочтению. PS. И хоть видно что публикацию сгенерила нейронка виден здравый поинт и мысль автора.
Опубликован 17 июл.
OpenAI презентует ChatGPT Agent. – Новый агент способен создавать файлы для Excel и PowerPoint – Google Sheets и Google Slides новый агент не поддерживает – Также новый агент позволяет совершать онлайн-покупки и др. – Анонсированный ChatGPT Agent работает на базе новой модели – Фактически, он работает аналогично агенту Operator от OpenAI – Новый агент доступен пользователям уровней Pro, Plus и Team – Для клиентов Enterprise и Education его запустят до конца лета – От Operator он отличается функциями «глубокого исследования» – Они позволяют синтезировать большие объемы данных из сети – ChatGPT Agent является комбинацией Operator и deep research – Агента можно использовать для бронирования ресторанов и др. Все смотрим тут: https://www.youtube.com/live/1jn_RpbPbEc?si=UGs2CbD3wWukTGjp
Опубликован 16 июл.
Бывший сотрудник OpenAI, который покинул стартап пару недель назад, написал огромный блог-пост о том, каково там работать Кельвин Френч-Оуэн работал в OpenAI год и занимался запуском Codex. Вот что интересного он пишет: 1️⃣ Внутренняя структура стартапа не вывозит быстрый рост количества сотрудников. За тот год, пока там работал Кельвин, OpenAI вырос с 1000 до 3000 людей. И да, им это необходимо, потому что продукты масштабируются беспрецедентно. Но структуры отчетности, онбординга, организация людей и найма страдает ну очень сильно. 2️⃣ При этом люди все еще работают так, как будто они в маленьком стартапе. Например, им все еще разрешается сразу же реализовывать все свои идеи без согласований и волокиты. С одной стороны – круто. С другой – начинаются дублирования, людей то куча. Кельвин пишет, что, например, видел десятки библиотек для управления циклами или очередями. Представьте, сколько это напрасно потраченного рабочего ресурса. 3️⃣ У сотрудников очень разные уровни кодинга. Есть инженеры Google, которые за день пишут сложнющие системы, а есть вчерашние PhD, которые не привыкли к продуктовому коду. И все они работают вместе: из-за этого главный репозиторий превращается, мягко говоря, в помойку. 4️⃣ В компании действительно сохраняется культура move-fast-and-break-things с быстрыми бессонными спринтами и запусками. По словам Кельвина, это того стоит. Но не всех устраивает не спать неделю… 5️⃣ Ну и классика: OpenAI не так уж и озабочены безопасностью. Элаймент заключается больше в чем-то практическом (не грубить пользователю, не манипулировать, не обсуждать политику и оружие), чем в искоренении каких-то общечеловеческих рисков ИИ. Ну так что, стрем или норм? calv.info/openai-reflections