TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #49 · 14.06

Мне очень нравится YouTube-канал Wintergatan. Вы, возможно, знаете его, но если нет, то наверняка видели 5 лет назад ролик Marble Machine — он тогда обошёл весь интернет (это НЕ тот ролик, который я приложил к посту, но тот вы без труда найдёте). Автор канала — шведский музыкант Мартин Молин — невероятно талантливый человек. Он не только мультиинструменталист с абсолютным слухом, но ещё и обладает прекрасным инженерным чутьём и изобретательскими навыками. Последние несколько лет он собирает у себя дома вторую версию этой самой Marble Machine — электромеханического музыкального инструмента, использующего для работы тысячи металлических шариков (marbles). Процесс сборки документируется на канале, и лично мне доставляет огромное удовольствие. Как человек с музыкальной школой и инженерным дипломом за плечами, я весьма высоко оцениваю и то, что делает Мартин по творческой части, и то, что по технической. Многие его инженерные решения просты в своей гениальности, при этом очень гармоничны и элегантны — как музыка :) Этот пример приближает меня к мысли о том, что противопоставление рациональной науки и иррационального искусства, равно как гуманитариев и технарей — не совсем верно. С какого-то расстояния и наука и искусство становятся очень похожи. Наш мир гармоничен, логичен и красив. И попытки отразить этот мир — хоть в картине, хоть в математической модели — неизбежно перенимают эти качества. https://youtu.be/b-nU21YgXTg #life

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #metaai

当前筛选 #metaai清除筛选
PHYGITAL+CREATIVE

@phygitalcreative · Post #3065 · 08.06.2023 г., 02:27

Мультимодальный AI Meta: будущее поиска, генерации и взаимодействия с виртуальным миром в 6 типах данных Мультимодальность постепенно проникает в нашу жизнь. Meta AI зарелизила в opensource работу с 6 модальностями, которая не только позволяет работать с текстом, изображениями и видео, но также с инфракрасными изображениями и другими данными, что открывает возможности работы с AR/VR информацией. Вот какие возможности это открывает: Мультимодальный поиск (аля Google, но одновременно по 6 модальностям). Пример: найди виртуальный мир, в котором есть пространство размером с футбольное поле, и в котором были танцующие котики. Арифметические вычисления с векторами. Если раньше "кошка" и "cat" для LLM были одно и то же по смыслу, то теперь 3D-модель кота и слово "cat" будут равносильны, а "3D-модель кота" + слово "счастливый" - фото усов позволит найти видео улыбающегося кота без усов. Кросс-модальная генерация (сейчас отдельно генерируем картинки и видео, а будем генерировать объекты в 6ти модальностях одновременно). Пример: "сгенерируй мне AR-мир с котиками на основе звука, как они мяукают". Исследование Meta AI в области мультимодальности является значительным шагом вперед в развитии AI и открывает новые возможности для работы с разнообразными данными. 📝 Paper: https://dl.fbaipublicfiles.com/imagebind/imagebind-paper.pdf 👨‍💻 Github: https://github.com/facebookresearch/imagebind #ai#multimodal#metaai#ar#vr#llm#opensourсe