TGINSIGHT CHAT
PHYGITAL+CREATIVE
@phygitalcreative
TechnologiesПишем про нейросети и Phygital+ — веб-приложение для дизайнеров и креаторов. ⚡️30+ нейросетей в одном месте ⚡️Уникальный нодовый интерфейс — контроль над каждым этапом генерации Попробовать бесплатно: https://phygital.plus Для связи: [email protected]
Postijiet reċenti
Paġna 73 minn 84 · 1,002 postijiet
Ippubblikat Apr 29
Doodle.com— неожиданно простой сервис для назначения встреч Когда снова нужно будет собрать на одной зум-встрече пятерых занятых людей, вспомните об этой штуке. Одному неудобно в 11:30, но можно в 14:00, у второго 14:00 уже занято, а третий вообще не определился. Такая задача решается грамотным использованием общих календарей, но когда «нет времени объяснять», проще создать мини-опрос в doodle, сбросить ссылку на него всем приглашенным и посмотреть, как они проголосуют. 📁 Попробовать // #ИИ#Сервис
Ippubblikat Apr 29
🖌Edit Everything: A Text-Guided Generative System for Images Editing A text-guided generative system without any finetuning (zero-shot). Edit Everything позволяет пользователям редактировать изображения с помощью простых текстовых инструкций. 🖥Github: https://github.com/defengxie/edit_everything ⏩Paper: https://arxiv.org/abs/2304.14006v1 🚀Dataset: https://paperswithcode.com/dataset/wukong ai_machinelearning_big_data
Ippubblikat Apr 29
1. Chat / Prompt -based Самый говорящий пример Midjourney или Wombo, где у вас ничего особо нет кроме диалогового окна для написания промпта и создания картинки, вижу как промежуточный этап 2. Page-based Тут тоже особо нечего говорить Google Colab, Hugginface, Replicate, Automatic1111 и любой сервис на основе SD для создания картинок. Понятный и логичный интерфейс для решения конкретной задачи. 3. LLM-based Интересное наблюдение - наш основной вектор развития в области 3DML строился на типах данных и их представлении в пространстве, когда как скорее нужно было идти от представления через текст и латентного пространства, а не геометрического. И сейчас мы видим весь этот бум вокруг GPT-based подходов, который описывает целые миры просто текстом Однако еще в 2018 году мы экспериментировали с текстом, но на тот момент не хватало трансформеров, мультимодальности, объемов данных да и мощностей для подобного рода прорыва. Поэтому переакцентировали внимание на CV / MV (да и вообще это ближе к графике, чем мы и занимались). И вот пример тестов на тот момент наиболее близкого совмещения пространственных и текстовых данных SSG(видео). Однако, в будущем LLM-based подход будет интегрирован во все интерфейсы (как пример Notion AI и Mymind). Будущее самих LLM-based подходов я вижу в таких системах как HuggingGPT, которые смогут совместить все лучшие практики из предыдущих концепций и следующих 4. Chain-based Параллельно идет развитие chain-based подходов к созданию удобных UI интерфейсов для работы с нейронными сетями. Наиболее интересные на данный момент подходы предложили Langchain и Lamini, по сути это такие Zapier для AI. Тут основными концепциями выступают компоненты, цепи и агенты. Но это скорее удобные интерфейсы для технически подкованных специалистов и соответственно ограниченного количества целевой аудитории. 5. Node-based Из примера выше для Langchain есть расширение Langflow, которое позволяет работать в нодовом интерфейсе, что позволит эти подходы вывести на больший круг аудитории. Также недавно Google представил свое видение нодового интерфейса для работы с большим количеством нейронных сетей. И в рамках исследования показали, что решение задачи с помощью нодового интерфейса превосходит все предыдущие по времени решения. Именно поэтому мы когда-то и сделали выбор в сторону данного подхода, однако это не значит что мы не будем меняться для предоставления лучшего опыта работы с ИИ, ведь наша задача сделать доступным AI для каждого, а нодовый интерфейс все таки еще обладает ограниченностью во входе не специалистов. Однако для решения профессиональных задач, где требуется внедрение в бизнес-процесс и решение комплексной задачи по созданию контента на данный момент это наиболее удобный интерфейс. Тут основными концепциями мы выделяем: нода, инпут/аутпут, пайплайн, шаблон, тип данных, связка преобразования (трансфигурация) 5. Canvas-based Но рано или поздно мы продвинемся в сторону Canvas-based подходов. Наиболее интересным я выделю сейчас Fermat.ws и Miro AI 6. 3d / XR -based Об этом пока совсем рано говорить, но JARVIS из Железного человека вот что будет по-настоящему нашим Усиленным Интеллектом. Наши концепты на этот счет 1 и 2
Ippubblikat Apr 29
Интерфейс взаимодействия с ИИ Я писал в предикшенах на 2023 год, что нас ждет много новых исследований и продуктов в области в том числе “улучшения интерфейса работы с ИИ”, чтобы говорить об изменении интерфейса хочу напомнить про типы данных, преобразования и некоторые первичные концепции Сегодня хочу выделить несколько наиболее интересных принципов по построению UI интерфейсов (все они являются частью нашего исследования NUE) - Chat / Prompt -based - Page-based - LLM-based - Chain-based - Node-based - Canvas-based - 3D / XR -based
Ippubblikat Apr 29
А ссылку на эфир, конечно, сюда я забыл скинуть) https://www.youtube.com/live/iIsY8C-8SxI?feature=share
Ippubblikat Apr 29
Очень красивая шпаргалка по всем языковым моделям (от word2vec до ChatGPT) Статья, GitHub
Ippubblikat Apr 29
Очень красивая шпаргалка по всем языковым моделям (от word2vec до ChatGPT) Статья, GitHub
Ippubblikat Apr 29
ControlNet без промта — UnpromtedControl Этим инструментом можно восстанавливать и удалять объекты просто выделяя их мышкой. При восстановлении картинки: если изначально не все трещины/проблемные места определятся, можно вручную набросать и уточнить маску для достижения лучших результатов. При удалении объектов из кадра: чтобы достичь хороших результатов выделите в маске не только элемент, который хотите удалить, но и его тень. Если не охота заморачиваться установкой локально, есть демо на колабе. Заходим в верхнем меню в Runtime — Run all, и когда все установки завершатся у вас будет две ссылки: одна для локального запуска, другая для публичного на Gradio. Обе активны в течение 72 часов, потом если что можно перезапустить. Попробовал вариант с Gradio и работает довольно хорошо. Гитхаб — Демо
Ippubblikat Apr 28
Пока вы тут ржали над папой римским и сгенерированным арестом Трампа, взрослые мальчики из политики расчехлили Generative AI и долбанули вот таким роликом по мозгам американских избирателей. Джо Байден объявил о своей кампании по переизбранию, и Республиканский национальный комитет (RNC) ответил вот таким вот ИИ-фейком. Видео (как вы уже убедились) содержит серию очень хорошо сделанных изображений, показывающих переизбрание Байдена в 2024 году. Оно демонстрирует, что это приведет к серии кризисов, среди которых, взрывы на Тайване после китайского вторжения и развертывание военных на улицах, предположительно, американских. Небольшой отказ от ответственности в верхнем левом углу кадра гласит: «Построен полностью с использованием изображений ИИ», а подпись под видео на YouTube гласит: «Созданный ИИ взгляд на возможное будущее страны, если Джо Байден будет переизбран в 2024 году». Вот это вот "Созданный ИИ взгляд на" - это прям виртуозный уход от ответственности. Я пока не нашел making of или детали, как это делали. Но думаю, что следующие выборы в штатах будут очень развеселые с точки зрения фейков, дипфейков и прочих созданных ИИ взглядов на происходящее. https://www.forbes.com/sites/ariannajohnson/2023/04/25/republicans-share-an-apocalyptic-ai-powered-attack-ad-against-biden-heres-how-to-spot-a-deepfake/
Ippubblikat Apr 28
Это Фредди Меркьюри поёт песню Imagine Dragons. Вот нейронка. А вот подробная инструкция на YouTube, как сделать так же.
Ippubblikat Apr 28
Нейрорендеринг в Блендоре. dream-textures для Блендора обновился и теперь это прям полноценный рендер, а не только текстуры. Поддержка ControlNet и OpenPose Colorize a Grease Pencil sketch Render a scene from a basic mesh A dedicated "Dream Textures" render engine is now available. It provides the node system and acts as an alternative to engines like Cycles or Eevee. https://github.com/carson-katri/dream-textures/releases/tag/0.2.0
Ippubblikat Apr 28
https://github.com/Mooler0410/LLMsPracticalGuide