#ПроФильмы
Наконец добрался до одного из "отложенных" фильмов.
Неуязвимый 2000 года, с Брюсом Уиллисом и Сэмюэлем Джексоном. Режиссёр - Найт Шьямалан.
Повествование очень неторопливое, история интересная и мрачная.
Необычное становление героя и любопытная концовка.
Понравилось. Рекомендую)
Потом выяснил, что он в одной вселенной с известным фильмом Сплит (2016) про человека с 23 личностями внутри (и секретной 24) и Стекло (2019), который полноценно объединяет всех персонажей в одной картине.
Очень удачно, что ни один из них я раньше смотрел. Теперь иду по порядку)
P.S. Насмотрелся Неуязвимого и пошёл помогать машины толкать из снега во дворе 💪💪💪
#ИИ#AI#AIVideo#MalikovAI#Neuralsense#Нейросуть#ИскусственныйИнтеллект#Art
📊 MARKET QUESTION LIVE
Will the Toronto Maple Leafs win their first April 2026 playoff game?
This isn’t about takes it’s about probability.
On EdgeMarket:
→ AI models track performance signals
→ Market sentiment is verified
→ Data updates in real time
Watch how the probability moves as we approach playoffs.
This is live predictive intelligence.
#EdgeMarket#NHL#SportsData#AI#Prediction
🌟LinumV2: T2V модель, которую делали вдвоем
Интересная история, которая доказывает, что в индустрии ИИ не всегда нужны миллиарды долларов и сотни сотрудников.
Знакомьтесь - проект Linum.
Два брата, Сахила Чопра и Ману Чопра, сделали две text-to-video модели на 2 миллиарда параметров, которые генерируют клипы длиной от 2 до 5 секунд в разрешении до 720p.
Согласитесь, это редкое явление в мире, где большинство видео-генераторов закрыты за платными API.
Изначально братья совсем не планировали заниматься генерацией видео.
Сахил окончил Стэнфордский университет в 2019, где в соавторстве разработал курс по LLM и занимался исследованиями в области когнитивных наук на стыке ИИ и лингвистики.
Ману досрочно окончил Калифорнийский университет в Беркли в 2021 г.. До основания Linum занимался исследованиями ИИ в биоинженерии.
Стартовав осенью 2022 года и пройдя через YCombinator, они пилили ИИ-инструмент для раскадровки фильмов. Но, пообщавшись с режиссерами, поняли: рынок слишком узкий, а творческий процесс у всех разный.
🟡Первая попытка создания видео-модели
Linum v1, была, по их признанию, франкенштейном. Они взяли за основу SDXL, раздули U-NET, превратив 2D-свертки в 3D и добавили временные слои внимания.
Получился забавный бот для Discord, который делал гифки в разрешении 180p. Это работало, но было тупиковой ветвью эволюции.
Расширять модель, заточенную под картинки, для работы с видео - плохая идея в долгосроке. VAE, идущий в комплекте с имидж-моделью, просто не умеет нормально сжимать и разжимать видеопоток. Качество на выходе получается никакое.
К тому же распределения данных в картинках и видео слишком разные, да и переучивать модель стоит дорого.
🟡V2 решили пилить с нуля.
VAE взяли от Wan 2.1, успев попутно разработать свой собственный temporal VAE, но решили сэкономить на эмбеддингах, DIT и T5 на роль текстового энкодера.
Представьте объем работы: двое парней делали то, чем обычно занимаются отделы с десятками сотрудников.
Они сами собирали датасеты, настраивали VLM для фильтрации контента, писали пайплайны для аннотирования архива видео.
И, конечно, бенчмаркали провайдеров, пытаясь понять, почему H100 у одного хостера работает хуже, чем у другого.
🟡К чему они пришли за 2 года разработки?
Linum v2 — pretrained веса. Модель пока ошибается в физике и эстетике, а генерация 5-секундного клипа в 720p занимает около 15 минут на H100 при 50 шагах.
Но, главное, братья не останавливаются: есть планы по ускорению через CFG и timestep distillation, работа над звуком и масштабированием.
@ai_machinelearning_big_data
#AI#ML#T2V#Linum
🧠 Учёные разработали мозговой интерфейс, который переводит мысли в речь с интонацией
Свежая статья в *Nature* описывает, как человек с параличом получил голос благодаря нейроимпланту.
Устройство считывает активность мозга и синтезирует речь со скоростью 40–60 слов/мин и точностью воспроизведения более 60 %.
📍 Как это работает:
— В мозг имплантированы 256 микродатчиков в вентральную двигательную префронтальную извилину — зону, отвечающую за речь
— Нейросеть расшифровывает активность речевой зоны
— Голос синтезируется мгновенно (~25 мс задержки)
— Человек *слышит* свой голос и может менять интонацию, задавать вопросы и даже петь
💬 Важно:
Это не просто текст. Это живая речь с эмоциями, восстановленная у человека, полностью утратившего возможность говорить.
Перспективная технология для всех, кто потерял голос.
📌Полная статья
@ai_machinelearning_big_data
#ml#ai#brain#nature
4 бесплатных мини-курса про ваш этот chatGPT
йоу. любители новейших ИИ разработок. Хотели разобраться со всякими chatGPT и Dalle-E2, но не было времени? Вы видели, что DeepLearning.AI (Andrew Ng, Coursera) выпустили 4 бесплатныхкурса по новейшим хайповым ИИ темам? Короткие, буквально 1.5 часа каждый, но зато можно реально разобраться что к чему. Что там есть:
1️⃣ChatGPT Prompt Engineering for Developers - 1.5 часа вас водят за ручку и рассказывают как оптимально использовать chatGPT (а по сути все большие языковые модели (LLM) для саммаризации, перевода, написания текста, экстракции информации в структурированном виде (json, html) и т.п.. В конце делаете своего мини чатбота по продаже пиццы. Не смотря на название продвинутых знаний в программиировании не требует.
2️⃣LangChain for LLM Application Development - как использовать инструмент LangChain для создания своих приложений на основе LLM. Винимание уделяется "агентам" - это когда последующее действие программы, зависит от результата предыдущего. Агенты самостоятельно выполняют эти действия.
3️⃣How Diffusion Models Work - как работают диффузионные модели. Мое любимое, потому что эти модели работают с изображениями. Учат как же так получается, что из шума появляются картинки. Знаний требуется побольше, чем в предыдущих курсах!
4️⃣Building Systems with the ChatGPT API - продолжение 1️⃣, с элементами 2️⃣, но уже для построения более продвинутых систем. Этот сам еще не смотрел.
Напомню, что у deeplearning.ai есть все, что нужно для вхождения в ML, кроме программирования и знаний английского: специализации по классическому машинному обучению, глубокому обучению, математика для машинного обучения и даже ИИ в медицине!
Все это не про Earth&Climate конечео, просто хочу поделиться.
#ML#AI#nongeo#course
🎤AI Product Stream в эфире: ИИ и право. Как создаются продукты для юристов? Стрим с продактом GigaLegal
Друзья, приглашаем вас на стрим 6 ноября в 19:00 (мск) с экспертом в создании ИИ-продуктов для юристов — Ксенией Брянцевой, продактом GigaLegal, инновационного ИИ-помощника для юристов, риелторов, маркетологов и других специалистов, работающих с юридическими документами. Подключайтесь, чтобы из "первых рук" узнать, как создаются продукты для одной из самых консервативных отраслей — юриспруденции.
➡️ Если есть вопросы, пишите их в комментарии
🔄UPD: видео прошедшей трансляции в комментарии
#ИИ#GPT#AI#нейросети#GigaLegal
———
#События
✍️Подписывайтесь: @aiforproduct