Сегодня будет самый "двоичный" ("двойковый"? "двушный"? "двойственный"?) момент на вашем веку 🤩
Больше двоек в дататайме вы не застанете!
Успейте поймать момент! Будете показывать эпичный скриншот своим внукам)))
🥸 Для продуманных (ленивых): код на скрине, который сработает только сегодня и только 1 раз!
⏱ Открывайте окошки с часами и вперёд!
#offtop
📝Вайб коддинг: Telegram-бот для видео-кружков
Делимся кейсом от Ivan Bannikov и канала DIV.
Автор собрал простого, но полезного телеграм-бота: @tgsharik_bot. Он принимает обычные видеофайлы и возвращает их в формате «кружочка» — такого же, как видео-сообщения в Telegram. Вдобавок реализована проверка на подписку: доступ к функционалу только у подписчиков нужного канала.
Проект собран в рамках тренировки и прокачки в работе с нейросетями и быстрым прототипированием.
➡️ Вот как это было сделано:
1. Подготовка идеи и структуры. Сначала в нейросети (Claude, но можно использовать любую — GPT, DeepSeek, Grok) прогнали саму идею, набросали структуру проекта и сформулировали описание продукта. Это позволило быстро очертить, что нужно собрать, как должно работать и какие есть требования. Полноценного ТЗ в виде файла не было — всё на уровне промтов и быстрых набросков.
2. Сборка через Replit. Полученные описания были загружены в Replit. Перед запуском генерации автор воспользовался функцией Improve prompt, которая немного дополняет и уточняет описание. Затем — Start building. Replit начал собирать проект, настроил окружение, поднял сервер и выдал первую рабочую версию.
Важно: тот же подход можно реализовать в Cursor, Bolt и других нейросетевых IDE. Replit просто удобен тем, что сразу разворачивает сервер и даёт ссылку для тестирования.
3. Работа с чат-агентом. С первой попытки всё не заработало — Replit собрал код с ошибками. Пришлось подключать встроенного чат-агента и разбираться вручную. В процессе выявили, что не хватает импорта для asyncio и других мелких моментов. После правок удалось добиться нормального запуска бота.
Совет от автора: если Replit не справляется с конкретной ошибкой, можно скопировать код и закинуть его обратно в GPT или Claude с описанием проблемы. Затем внести предложенные правки в Replit. Такой способ сработал.
4. Деплой и запуск. Когда бот заработал, проект остался хоститься прямо на Replit. Для MVP и тестовой нагрузки этого достаточно. В случае роста можно либо перенести на внешний сервер, либо выгрузить как архив и задеплоить вручную.
🔥Итого: Простой бот, сделанный с помощью нейросети, без погружения в тонкости разработки с нуля. Это позволяет за один-два вечера собрать рабочее решение, поэкспериментировать и выкатить тестовую версию. Главное — не бояться отлаживать и дорабатывать руками.
#ИИ#AI#Нейросети
———
#Кейс#Код
✍️Подписывайтесь: @aiforproduct
Вот как звучит голосовая модель - я взял за основу 2 часа диктора какой-то сказки, и засунул его в качесвте датасета (кстати оригинал звучит менее приятно).
Примечательно, что модель делает паузы и остановки - хотя иногда читает текст не приавльно (например не так ставит ударения). Но для этого я сделал контекст анализ - который выявляет смысл предложения и правильно расставляет ударения (еще один датасет который требуется наполнить правилами и массивами 😒).
Есть более мощная модель - но она не мультиязычная, а мне хочется сделать так, чтобы даже с Пушкиным мог поговорить человек из любой страны.
Ниже представлено звучание модели:
1. Датасет на вход
2. Синтез на русском
3. Синтез на анлийском (здорово, что если в датасете нет англоязычного произношения, то голос на выходе будет звучать так, будто русский человек пытается произность янглоязычный текст). Представьте как тот же Пушкин будет говорить "Хелло май фриендс, ай эм Пушкин - а врайтер оф зе найнтентх центури" 😂
#код#хобби#обучение
Последние 3 дня разбирался с text-to-speech и нашел отличную мультиязычную голосовую модель которая подтягивает любой голос без длительного обучения (сразу съедает wav файл и работает). Дописал логику всего основного back проекта , теперь скрипт распознает голос, отправляет на llm, получает ответ и озвучивает его создавая wav файл очень качественным голосом (по качеству как GPTo но еще слабоват на русском ибо модель англоязычная, но это не проблема, дообучим). В общем, новой технологии БЫТЬ! База готова , осталось развернуть мощности и сделать качественные 3D модели портеров с минимальным количеством полигонов, ну и обернуть это все в интерфейс с индикацией и доступом.
Впрочем сейчас не об этом, пока мощностей нет, придется взять паузу по разработке. Пока делал основу, понял что нужна Lite версия без сложных 3D портретов. Чтобы люди могли сами загрузить фото, написать промты, подгрузить нужный голос и сгенерировать Lite-portrait. Суть такая, поверх лица накладывается 3d сетка и поинтами деформирует основную фотографию/видео при подаче на нее wav файла - это значительно легче и проще при нагрузке на железо как со стороны сервера так и со стороны пользователя, да это не прям хайтек движения, но и не у всех есть пару лямов сейчас сделать полноценную 3D копию.
Портал для масс где можно создать копию человека в 3 шага, даже при типичной анимации - это уже качественный инструмент сохранения памяти и личностей, плюс сбор бигдаты и датасетов для будущих нейронок.
Вангую через пару лет будет нейросеть которая автоматически генерирует 3D assets человека и нейронкой же ее анимирует по заданному датасету (не путать с veo3! для такой истории не хватит ресурсов Реалтайм анимацию рисовать, максимум для создания шаблонного видео). Тут вопрос только в большой базе данных 3д сканов и фотограмметрии, плюс шаблонных анимаций мимики и движений телом) - возможно даже мы сделаем эту самую нейросеть, но пока об этом рано думать.
Возвращаясь к lite версии портретов: планирую сделать достаточно простой датасет, снять часов на 200 (для начала) разговорную анимацию людей, синхронизировав чекпоинты мимики с входящим wav потоком, чтобы на будущее модель понимала какое положение точек в пространстве делать при воспроизведении аудио. После обучения, такую 3д маску можно будет наложить на любую фотографию, выбрать или загрузить голос и написав промты - создать упрощенную версию портрета любому юзеру. И при воспроизведении wav ответа от llm - чекпоинты будут выстраивать правильные координаты положения в пространстве, анимируя основную фотографию в realtime!
Завтра загружу аудио из text-to-speech, покажу как звучит модель 🤓
С нейронкой программирую всего неделю, а вижу очень большие движения и многое пересматриваю в процессе работы над проектом!
#код#хобби#обучение
2 дня активного общения с GPT и выявление проблем при запуске обучения на собственном датасете - я все таки смог собрать рабочий скрипт который работает!! (в рамках безопасности разумеется я его не показываю) 🫵
Теперь полученный датасет в предыдущем посте используется для обучения собственной голосовой модели которую мы будем использовать в портретах. Фишка в том что для этого требуется всего лишь чистый голос в формате wav на 20-60 минут студийной записи и на выходе мы получим качественный voice.
Дожидаться конца обучения я не стал поскольку на CPu макбука это займет неделю - и для качественного обучения требуется GPu с ядрами CUDA хотя бы на 8000 штук (а это карты формата rtx 4080 и больше) что не дешевое удовольствие )
Сейчас я делаю архитектуру на macOS но в ближайшее время буду переносить все на Linux с достаточно мощным оборудование (отдельный сервер).
Факт: программировать с помощью чата GPT реально и не вызывает особой сложности у людей, которые хоть немного разбираются в IT.
Следующий шаг - распознание речи, голосовое общение с llm, получение текстового ответа и превращение ответа в wav файл. А также скормлю GPT базу данных чтобы он связал все между собой и мог привязать голос и промты к конкретным I’d портретов для комфортного подключения.
Upd.:- Голосовая модель не актуальна! Используется другая более современная!
#код#хобби#обучение
#код#хобби#обучение
Начал самостоятельную разработку портретов новой технологией с помощью чата GPT. Буду делится шагами и результатами
Этап первый. Обучение голосовой модели портера.
Задача: обучить TTS (text-to-speech) на собственных wav файлах для последующего использования в портретах.
Решение: автоматическая система преобразования входных данных под обучение tts.
1. Добавляем wav файл в папку
2. Задаем скрипт который разбирает файл wav (20-60 минут) на куски 3-5 секунд
3. Используем speech-to-text который преобразует wav куски в текст для последующего обучения (используем whisper модели large)
4. Запускаем разбор wav на куски с помощью скрипта
Итог: задача выполнена, получен датасет готовый к обучению для text-to-speech
😎
В чем польза: достаточно просто поместить голосовую студийную запись в папку и нажать обучение - скрипт автоматически подготовит датасет под обучение.
Следующий шаг обученая модель с нужным голосом подключенная к LLm с преобразованием в wav файл.
Upd.:- Голосовая модель не актуальна! Используется другая более современная!
❗️Показываем подробно как сделать игру для ТГ
После последней публикации поступили вопросы как именно запустить игру в ТГ. Мы подробно описали весь механизм в нашем Дзен канале "Шашков & Головко • AI в решениях". Процесс на самом деле несложный, доступен с базовыми знаниями.
На видео — демонстрация всех шагов:
🔹Генерация кода игры через Claude
🔹Размещение на GitHub Pages
🔹Интеграция с Telegram через BotFather
🔹Запуск готового приложения
От идеи до рабочей игры можно добраться за 30 минут. Программировать самостоятельно ничего не надо.
Читать подробную инструкцию🔵Попробовать готовую игру
#ИИ#AI#Нейросети#Claude
———
#Инструменты#Код
Подписывайтесь: @aiforproduct
💬Создаем Telegram Mini Apps через Claude
Решили проверить, насколько хорош Claude в создании готовых мини-приложений под ключ.
Дали простой промт:
а ты можешь мне создать приложение в виде игрушки простой, которую можно в ТГ погонять прямо в чате?
🗂Результат:
- Claude сразу создал полноценную игру с интерфейсом
- Код работал с первого раза, без доработок
- За десяток минут от промта до готового приложения в ТГ (для реального запуска нужно разместить на GitHub и создать приложение через @BotFather)
Теперь наша игрушка работает прямо тут, в ТГ! Зайдите в приложение и оцените качество быстрой генерации.
#ИИ#AI#Нейросети#Claude
———
#Инструменты#Код
Подписывайтесь: @aiforproduct
❤️🔥Claude Code - тот случай, когда часами можно смотреть, как кто-то работает.
На видео демонстрируем новый инструмент от Anthropic — Claude Code. Это помощник для разработчиков, который позволяет работать с вашим кодом прямо в терминале. Он подключается к проекту и все делает буквально за вас. Вам останется только тестировать и давать команды.
Что умеет:
- Создаёт полноценные проекты по вашему описанию. Достаточно хотя бы на пальцах объяснить, что нужно.
- Сам анализирует файлы и структуру вашего кода, или создает все с нуля.
- Исправляет ошибки, получив лог
- Добавляет новую функциональность
- Отвечает на вопросы о коде
💎 Точно может сэкономить часы работы, особенно, если вы не совсем программист. С лёгкими проектами справляется за день. На видео создание бота заняло всего 15 минут. Понимает контекст и честно отвечает на вопрос: "Это ты костыль поставил?". Может работать в разных терминалах с несколькими проектами одновременно.
Доступно в подписке Claude Max от 100$ в месяц. ВПН.
#ИИ#AI#Нейросети#Claude
———
#Инструменты#Код
✍️Подписывайтесь: @aiforproduct
📄Делимся наблюдениями: как работать с Claude Code на больших проектах
Несколько месяцев экспериментируем с Claude Code. Наделали ошибок, набили шишки, нашли работающие принципы.
Последний тест — создать большого многофункционального бота (не скрипт на 50 строк, а полноценную систему). Получилось за неделю, при том что код писал гуманитарий и ручками ничего не правил.
Главные наблюдения из опыта:
➡️Без детального ТЗ — провал. Claude фантазирует и делает не то. 40 листов документации окупаются за первые же часы
➡️Мантра "никаких костылей" спасает проект. Повторяем каждое второе сообщение
➡️800+ строк в файле = катастрофа. Claude начинает дублировать функции, все ломается
➡️Ежедневная уборка критична. Временные файлы превращают проект в помойку
➡️Перезапуск Claude обязателен после крупных блоков. К третьему сообщению забывает все правила
➡️Контролируем процесс. Видим "сделаю пока вот так" — сразу останавливаем
➡️Только Opus справляется с большими задачами. Sonnet плывет.
Подробно расписали фишки на Дзене "Шашков & Головко • AI в решениях".
Код выложен на GitHub — можете оценить сами.
Какие у вас наблюдения при работе с большими проектами в Claude? Поделитесь опытом!
#ИИ#AI#Нейросети#Claude
———
#Кейс#Код
✍️ Подписывайтесь: @aiforproduct
✨Вайбкодинг. От восторга до полного краха за 3 дня
В Дзен-канале "Шашков & Головко • AI в решениях" разобрали кейс продакта Максима Шведенко. Он решил проверить вайбкодинг на реальной задаче. Обычно на создание планировщика проектов у него уходил целый спринт.
➡️Условия: только Cursor, никакого кода с клавиатуры
День 1: AI создал рабочий планировщик из 3 файлов. Максим в шоке: "Реально работает!"
День 2: При добавлении новых фишек начались проблемы. AI стал ломать старое, зацикливаться, игнорить требования. Максим впервые нарушил правила и вмешался в код.
День 3: Полный провал. Cursor начал удалять функционал, переписывать проект с нуля. Файл в 2000+ строк стал неуправляемым. 🔳🔳🔳🔳🔳🔳🔳🔳🔳...
🔥8 ключевых выводов:
🔸Вайбкодинг работает — но только для проектов средней сложности
🔸 Архитектуру планируй сразу — один файл на 2000+ строк = провал
🔸Тестируй постоянно — AI ломает старое, добавляя новое
🔸Промпты решают все — размытые инструкции не работают
🔸Экономия времени — огонь — 2 дня вместо 2 недель
🔸 Техника влияет — плохой VPN = плохой результат
🔸AI зацикливается — может переписывать сам себя без запроса
🔸С дизайном все плохо — нужны очень точные требования к UI
Читать полный разбор • История от автора
#ИИ#AI#Нейросети#Cursor
———
#Кейсы#Код
✍️Подписывайтесь: @aiforproduct
Ницше говорил, что философ должен быть филологом и психологом; сегодня философ должен быть историком и техником. Хочешь быть философом — пиши романы, говорил Камю; сегодня философ должен писать код. Технические специалисты не создали теорию эволюции кода, поскольку им чужд историзм как метод познания, философы — поскольку они не способны преодолеть свою исходную, обусловленную самой ситуацией рождения философии нелюбовь к технике.
Генезис графического пользовательского интерфейса. К теологии кода Михаил Куртов 21 июня 2014 г. с.4-5.
#философия#техника#история#код.
✏️Replit — это платформа, где можно собрать рабочее приложение, бота или веб-сервис без навыков программирования
Если коротко: описываете, что нужно, а встроенный помощник (Replit Agent) сам генерирует проект. Структура, код, нужные файлы — всё появляется автоматически.
📎 Мы тестировали, как на Replit собрать Telegram-бота, который отвечает на вопросы через GPT — по-русски, с характером, дерзко, иногда даже с матюками.
На бесплатном тарифе дают 10 генераций — этого хватает, чтобы собрать MVP и проверить, будет ли идея вообще работать. Если нужно больше — можно дописать руками или перейти на платный план.
Replit подойдёт, если:
– нужно быстро собрать бота, игру, сайт или тестовую идею
– нет желания возиться с установками и настройками среды
– кода нет, но идея есть
🔥 Для продакшена и постоянной работы такой бот уже лучше перенести на стабильный хостинг. Но как старт — Replit очень даже.
Видео выше — весь процесс от начала до запуска.
#ИИ#AI#Нейросети#Replit
———
#Инструменты#Код
✍️Подписывайтесь: @aiforproduct