TGINSIGHT CHAT
Семён: Нейросети в каждый дом
@semasci
ТехнологииИскусственный интеллект для домашнего использования: разбираю нейросетки сам и даю рекомендации по их использованию без дополнительных знаний. ✉️@SemenMartyushov
Последние посты
Стр. 50 из 80 · 960 постов
Опубликован 20 янв.
✅Hugging Face запустил бесплатный курс по созданию AI-агентов Тема Ai-агентов становится все горячей и горячей, в продолжение ряда статей (OpenAI Operator и AI-агенты в Gemini) удивительно логично ложится новость про бесплатный курс по Ai-агентам от Hugging Face. Этот курс предназначен для всех, кто интересуется будущим искусственного интеллекта. Независимо от того, являетесь ли вы разработчиком, специалистом по данным или просто интересуетесь искусственным интеллектом, этот курс предоставит вам знания и навыки для создания собственных интеллектуальных агентов. Вот чему вы научитесь: 📖 Изучите основы работы с агентами с нуля. Будут продемонстрированы основы AI-агентов, как они используют языковые модели для восприятия окружающей среды (observations), размышления над ней (thoughts) и выполнения действий. 🕵️ Создадите своих собственных агентов с использованием новейших библиотек и инструментов: LangChain, LlamaIndex и smolagents. 🎓 Получите сертификат об окончании курса, чтобы продемонстрировать свои достижения. Записаться можно здесь. пс.я записался... https://t.me/semasci
Опубликован 19 янв.
Искусственному интеллекту нужно хорошее железо, а естественному - здоровье. Предлагаю начать готовиться к зелёному марафону эти летом. Понедельник - хороший день для старта!!! 👍 да, побежали 🤫 зачем бежать, все сделают роботы ) 😇 У меня лапки, посмотреть варианты)
Опубликован 19 янв.
Minimax - голос! И завершаем на сегодня посты о MiniMax сообщением о модели T2A-01-HD: генерации голосовых сообщений. Пушка, по крайней мере сейчас, в режиме свободной генерации: 1. 50 голосов на английском и 8 на русском. 2. Возможность записать Ваш собственный голос. 3. Есть эффекты на голос, например шум аудитории, телефонный звонок или роботизированный голос. 4. Почти онлайн генерация, мега быстро. 5. Огромное текстовое окно, 5000 символов. 6. Удобная авторизация и сохранение результатов. И минусов пожалуй только необходимость включать режим "компьютер" на телефоне и нет автоматического перевода текста на другие языки.. ну это я скорее уже привередничаю... Крайне рекомендую в активное использование T2A-01-HD от MiniMax. Пс. Ранее о моделях tts писал: 1. Voice Isolator от ElevenLabs 2. Coqui Минимакс точно выигрывает в удобстве. Понял, что мало смотрел в направлении классов text2voice и text2speech, буду исправляться: поставил в расписание Qwen2 Audio и KokoroTTS. https://t.me/semasci
Опубликован 19 янв.
Minimax - Видео с вашим персонажем У китайской модели Minimax (сайт HailuoAI.video) появилась возможность генерить видео по промпту с вашим персонажем: указываете себя любимого или ранее сгенерированную вымышленную фигуру и дальше текстовым промптом задаёте нужное действие для видео. Похоже сервис пользуется успехом, так как в бесплатной версии дают только две генерации (через неделю новых не добавили). Чтобы потестировать и принять решение о покупке подписок достаточно. Промпты для данных видео: 1. "с 01 по 02 секунду катаюсь на волнах на виндсерфе с гавайской рубашке, с 3 секунды выхожу на берег в смокинге..." персонаж - я. 2. "Девушка скачет на лошади на фоне заката и берега океана." Персонаж - ИИ генерация. Ранее тестировал minimax, интересен прогресс в качестве: 1. Сентябрь 2024 года - первое появление модели в открытом доступе. 2. Генерация на китайском сайте. 3. Появление собственного сайта с английским языком. 4. Оживление статичных картинок на картинке "Ai is coming for our jobs". https://t.me/semasci
Опубликован 19 янв.
Minimax - к шикарному text2video добавили средненькую LLM и шикарный голос (tts)... Сегодня день постов про MiniMax: Китайская компания MiniMax на неделе представила три модели: MiniMax-Text-01, MiniMax-VL-01 и T2A-01-HD для работы с текстом, изображениями и речью. MiniMax утверждает, что модель MiniMax-Text-01, состоящая из 456 миллиардов параметров, работает лучше, чем недавно представленная Google модель Gemini 2.0 Flash на таких тестах, как MMLU и SimpleQA, которые измеряют способность модели решать математические задачи и отвечать на вопросы, основанные на фактах. В целом языковая модель приятная для обычных задач обобщения текста или лёгкой беседы на уровне остальных собратьев. Прикручена удобная авторизация и есть сохранение диалогов. Но мне не зашла: 1. Все мои задачки провалила: рассуждения есть, но все время уходит от правильного ответа. Подтвердить, что модель хороша в математике не могу... 2. На предложение добавить записи в мой календарь бодро согласилась, но в конце диалога попросила меня добавить записи руками, так как у нее нет нужного api. Если бы мне год назад рассказали бы об этой модели, я наверное был бы в большем восторге, но сегодня уровень поднялся до небес и обычная LLM вообще не вызывает каких то супер эмоций... Использовать ее или применять другие - дело вкуса... А вот голосовая модель и видео - огонь, но об этом в следующих постах... Напомню, что в России, без VPN бесплатно и на русском доступны следующие языковые модели: 1. Гигачат (веб и телеграм). 2. Яндекс Нейро. 3. Мистраль из Франции. 4. DeepSeek из Китая (+ AppStore) 5. Семейство моделей Qwen из Китая. 6. Облегченная модель Phi-4 от Microsoft. Другие LLMки, включая разные версии ChatGPT, можно условно бесплатно найти на сайтах агрегаторах: you.com, DuckDuckGo или liner... Под VPN доступны ChatGPT, Gemini и скоро ожидаем Grok-3. https://t.me/semasci
Опубликован 18 янв.
Наткнулся у соседей на интересную модель: Сортирует пиксели по цвету с поданного на вход изображения. Не могу только понять, где ее применять, но залипательно, практически как лопать попит. Да и что ещё делать в выходной? )) Попробовать можно тут Исходники здесь Автор https://t.me/semasci
Опубликован 17 янв.
А знали ли Вы? А знали ли Вы, что если почти в любую LLM подать картинку и попросить "напиши промпт, который позволит сгенерировать такую картинку", то Вы получите весьма добротный промпт для полета своей фантазии... пример: картинка из этого поста->GigaChat->промпт->Kandinsky 4.0->картинка Попробуйте за обедом)) https://t.me/semasci
Опубликован 17 янв.
В продолжение поста об уже доступных пользователям ai-агентах в Gemini 2.0 предлагаю ознакомиться о планах Google в статье от Сбера. Из супер интересного - прототип genAI-агента Project Mariner для Chrome (аналог Operator от OpenAI и агента от Claude). Очень хочу до него дотянуться и потестить.... Цитата из статьи: На основе новой модели создали прототип genAI-агента Project Mariner для Chrome. Работая как браузерное расширение, он может выполнять действия в интернете за пользователя: перемещать курсор, открывать сайты, нажимать кнопки и заполнять формы. Тестирование проходит и genAI-агент Jules. Он помогает разработчикам писать и редактировать код, интегрируясь в рабочие процессы в GitHub. Jules станет доступен в 2025 году На основе Gemini 2.0 бигтех разрабатывает genAI-агентов для помощи геймерам. Агент будет интегрироваться в игру, анализировать игровой процесс и предлагать оптимальные стратегии в реальном времени. Новый агент Genie 2 сможет создавать игровые миры на основе изображения Google показал прототип genAI-помощника Project Astra, обновленный с помощью Gemini 2.0. Теперь он может разговаривать на нескольких языках, использовать Google Search, Maps и Lens, а также запоминать больше данных (например, до 10 мин видеопотока с камеры), сохраняя конфиденциальность. Его тестируют и в умных очках, но нет никаких точных данных о планах и сроках запуска как обновленного Project Astra, так и очков. https://t.me/semasci
Опубликован 17 янв.
DeepSeek V3 в iPhone DeepSeek V3 стал доступен в российском AppStore — можно скачать с основного аккаунта. https://apps.apple.com/ru/app/deepseek/id6737597349 Тестировал здесь, очень достойная модель.. при наличии приложения становится ещё удобнее... Ждём аналога в android.. В Google play есть приложение DeepSeek, но это левак, ждём оригинал... https://t.me/semasci
Опубликован 17 янв.
Ai-агенты в Gemini 2.0 от Google Пост про "ai-агентов и зачем они вообще нужны" продолжаем с Gemini 2.0: Буквально неделю назад тестировал и ругался на полное отсутствие интеграции модели от Google с сервисами Google... А сегодня я форварднул сообщение от зубной клиники в чат с Gemini и через пару секунд на выходе получил две записи в Google Calendar. Вторым голосовым запросом нашел информацию в документах на моем диске Google. Вот оно - удобство... Да, редактирование записи календаря из Gemini сейчас не доступно и напоминалок, как у ChatGPT, тоже нет. Интеграция Gemini пока есть только с календарем, почтой и диском, с другими сервисами отсутствует, но ещё неделю назад и этого не было... Сервисы меняются на глазах и в лучшую сторону... Ссылка: https://gemini.google.com/ https://t.me/semasci
Опубликован 16 янв.
Voice generation от MiniMax Во многих каналах проскочила новость про мега модель text2voice от китайской Minimax (hailuo.ai) Не хочу просто форвардить рекламный ролик, хочу на выходных разобрать детальнее и понять, насколько она реальна для домашнего использования.... Плюс, как раз на выходные заготовлен пост про text2video с заменой лица на вашего аватара, тоже от Minimax. Пс. Судя по количеству анонсов от Minimax, ребята готовятся к китайскому новому году, закрывают тикеты. Не удивлюсь, что к выходным ещё модельку-другую выпустят)) https://t.me/semasci
Опубликован 16 янв.
Какой красивый пост, а могут ли остальные так? Ээх, никакой романтики у французкого мистраля, русского гигачата, и американского chatgpt. Так, стоп.... Может дело во мне? )) https://t.me/semasci