TGTGInsighttelegram intelligenceLIVE / telegram public index
← Robot.ltd.co
Robot.ltd.co avatar

TGINSIGHT POST

Post #255

@robotltdco

Robot.ltd.co

Views295Post view count
PostedAug 1308/13/2025, 12:52 AM
Post content

Post content

🤖 Внедряю «зрение» в роботов Адам и Ева! from ultralytics import YOLO import app_adam_yagpt # Загрузка модели YOLOv8l (официальная версия) model = YOLO("yolo11l.pt") # Автоматически скачает, если нет # Детекция на изображении results = model("image2.jpg") # Получаем текстовый вывод в переменную detection_summary = results[0].verbose() resp = app_adam_yagpt.main(f"С помощью компьютерного зрения я передаю тебе данные об изображении. " f"Опиши пространство в литературной форме, и классифицируй где ты находишьcя, " f"что за обстановка и характер мероприятия или встречи, улица это или помещение, если перед тобой: {detection_summary}. " f"Не нужно спрашивать ничего в конце твоего описания. ") print(resp) # Визуализация results[0].show() # Покажет результат results[0].save("output.jpg") # Сохранит bash В пространстве находятся пять человек, двое из которых одеты в деловые костюмы. Присутствует телевизор, компьютерная техника — мышь и клавиатура, а также мобильный телефон. Обстановка выглядит как офисное помещение или место для работы и коммуникации. Собрал связку YOLOv11 + GPT, чтобы робот не просто видел объекты, но и описывал обстановку почти как человек. Как это работает: 1️⃣ YOLO детектит объекты на изображении 2️⃣ GPT анализирует их и генерирует "очеловеченное" описание 3️⃣ Profit! Зачем это Адаму и Еве? Адам сможет: — Опознавать людей и их действия («Вы пьёте кофе? Ваш офис выглядит уставшим»). — Находить предметы по запросу («Где мои ключи?»). Ева получит: — Анализ эмоций через позы/объекты («Вы нервничаете? На столе пустой кофе»). Следующие шаги: 🔜 Внедрение в «железо» — тесты на реальных роботах. 🔜 Голосовой вывод — чтобы Адам комментировал увиденное вслух. 🔜 Обратная связь — если робот ошибся, он запомнит исправление. Сценарии использования: Дома: «Ева, кто оставил грязную кружку?» → «Это сделал Сергей, 5 минут назад» (по детекции лица + времени). В офисе: Адам предупредит: «Переговоры начнутся через 10 минут — в зале пока только двое».