🔥Как работает нейросеть? — [9:59]
Нейросети уже заполонили мир, особенно ChatGPT и Midjourney, поэтому важно приблизительно понимать как они работают. В этом ролике речь пойдёт об общем строении ИИ, что такое нейрон, вес и как подбирается результат.
Перейти к просмотру
#видео#ai
👀 Релиз SAM 3.1 - одной из самых сильных open-source моделей для компьютерного зрения.
Модель понимает, что происходит на изображении или видео, и умеет находить объекты по текстовому описанию. Можно буквально написать «человек в красной футболке» и она найдёт нужных людей.
Работает не только с картинками, но и с видео. Объект можно задать один раз, и дальше модель будет отслеживать его между кадрами.
Ключевая идея - open-vocabulary. Модель не ограничена фиксированными классами, как старые системы. Она оперирует огромным количеством понятий и может находить практически любые объекты.
Ещё важный момент можно комбинировать способы управления: текст, клики, рамки, маски. Это даёт гораздо больше контроля и точности.
Под капотом новая архитектура, где отдельно решаются задачи поиска объектов и их отслеживания. За счёт этого модель лучше различает похожие вещи и стабильнее работает на видео.
В репозитории уже есть всё для старта: готовые веса, код, примеры и ноутбуки.
По факту это уже не просто инструмент для разметки, а полноценный vision-движок, который можно встраивать в реальные продукты от аналитики видео до автоматизации разметки данных.
Теперь модель может отслеживать до 16 объектов за один проход.
С multiplexing все объекты обрабатываются одновременно:
• меньше лишних вычислений
• нет узких мест по памяти
Результат: скорость обработки видео увеличивается примерно в 2 раза
с 16 до 32 FPS на одном NVIDIA H100!
На новом бенчмарке SA-CO, который включает 270 тысяч уникальных концептов, SAM 3 достигает 75–80% от уровня человека.
https://github.com/facebookresearch/sam3
@ai_machinelearning_big_data
#ai#ml#llm#cv#python
🌟LLM Council: на ваши запросы отвечает совет из языковых моделей.
Андрей Карпаты опять выходит на связь опубликовал очередной vibecode проект.
Его идея в том, что вместо того, чтобы задавать вопрос одной LLM, вы можете объединить их в «Совет моделей».
LLM Council - это простое локальное веб-приложение, с интерфейсом как у ChatGPT, но с той разницей, что запрос отправляется через Openrouter нескольким LLM. Полученные ответы перекрестно оцениваются и ранжируются, и, наконец, «модель-председатель совета» формирует окончательный ответ.
Более подробно процесс выглядит так:
🟢Этап 1: Сбор мнений.
Запрос отправляется всем моделям по отдельности, и их ответы собираются. Ответы каждой модели отображаются в отдельной вкладке, чтобы можно было их посмотреть вручную.
🟢Этап 2: Рецензирование.
Каждая модель получает ответы других моделей. При этом идентификаторы анонимизированы, чтобы исключить «игру в любимчиков» при оценке чужих результатов. На этом этапе ответы ранжируются их по точности и глубине анализа.
🟢Этап 3: Итоговый ответ.
Модель-председатель принимает все ответы моделей и компилирует их в единый окончательный ответ.
⚠️ Для использования нужен API-ключ OpenRouter. На платформе есть бесплатные модели
🖥Github
@ai_machinelearning_big_data
#AI#ML#LLMCouncil#Github
🗣️Voxtral: возвращение голоса как интерфейса
Голос был первым пользовательским интерфейсом — задолго до письма или клавиатуры. Сегодня, когда технологии всё ближе к человеку, он снова становится ключевым способом взаимодействия. Но существующие голосовые решения либо закрыты и дорогие, либо недостаточно точны и гибки.
Команда Voxtral представила открытые модели понимания речи, призванные закрыть этот разрыв.
🧠Что такое Voxtral:
• Две модели: 24B (для продакшена) и 3B (для локальных и edge-сценариев)
• Открытая лицензия Apache 2.0
• Доступ через API и оптимизированный endpoint для транскрипции
• Разработка на основе Mistral Small 3.1
📌Возможности моделей:
• Распознавание аудио до 30–40 минут (32k токенов контекста)
• Встроенные вопросы и ответы, суммирование, мультиязычность
• Автоматический вызов функций из голоса — API, скрипты, бэкенды
• Высокая точность понимания текста и смысла
• Поддержка языков: английский, испанский, французский, немецкий, хинди, итальянский, португальский и др.
🧩Идеально подходит для:
- Голосовых ассистентов
- Поддержки клиентов
- Звонков и интервью
- Автоматизации рабочих процессов по голосу
🔗https://voxtral.ai
@ai_machinelearning_big_data
#ml#ai#voxtral#mistral
US Copyright Office reports ‘urgent need’ for protection from deepfakes
The U.S. Copyright Office has issued a compelling report highlighting the urgent need for new legislation to address the rise of digital replicas, commonly known as deepfakes. Released on July 31, the report underscores the profound risks posed by AI-generated digital replicas, not only in entertainment and politics but also for private individuals. The office calls for a law that is distinct from existing copyright infringement statutes, aimed specifically at mitigating the unique threats of deepfakes.
Shira Perlmutter, Register of Copyrights and Director of the US Copyright Office, emphasized the gravity of the situation: “The distribution of unauthorized digital replicas poses a serious threat not only in the entertainment and political arenas but also for private citizens. We believe there is an urgent need for effective nationwide protection against the harms that can be caused to reputations and livelihoods.”
The proposed law would focus on the distribution and availability of unauthorized digital replicas rather than the act of creation alone, acknowledging the nuanced nature of creative processes. This proactive approach aims to protect individuals and businesses from financial, reputational, and personal harm, setting a foundation for robust national safeguards.
#Deepfakes#CopyrightLaw#AIandLaw#AI
Сакура распускается, даже если её создали алгоритмы. Где граница между искусственными и настоящими кадрами? Может, её больше нет?
#нейро#видеограф#нейросеть#AI#filmmaker#art#tech#digitalArt
New requirement: US lawyers must disclose use of generative AI, says Federal judge
In a groundbreaking development, Brantley Starr of the Northern District of Texas has issued a groundbreaking court order that mandates all lawyers to file certificates disclosing their use of generative Artificial Intelligence (AI) technology.
Judge Starr’s new order requires the following:
All attorneys and pro se litigants appearing before the Court must, together with their notice of appearance, file on the docket a certificate attesting either that no portion of any filing will be drafted by generative artificial intelligence (such as ChatGPT, Harvey.AI, or Google Bard) or that any language drafted by generative artificial intelligence will be checked for accuracy, using print reporters or traditional legal databases, by a human being.
This requirement aims to ensure transparency and accountability in legal proceedings involving AI-generated content.
#artificialintelligence#ai#law#chatgpt
📌Google разработала алгоритм квантования KV-кэша без потери точности.
Подразделение Research анонсировало TurboQuant, алгоритм векторного квантования, объединяющий 2 других метода - QJL и PolarQuant, который решает проблему увеличения KV-кэша при работе с длинным контекстом.
TurboQuant будет представлен на ICLR 2026, PolarQuant - на AISTATS 2026.
KV-кэш хранит промежуточные представления токенов, чтобы модель не пересчитывала их на каждом шаге генерации. С ростом контекста он превращается в узкое место по памяти.
Обычное векторное квантование сжимает эти данные, но вносит накладные расходы: для каждого блока нужно хранить константы квантования в полной точности, а это плюс 1–2 бита на элемент, что частично обесценивает само сжатие.
🟡TurboQuant - двухэтапный пайплайн.
Сначала PolarQuant: случайный поворот выравнивает геометрию векторов, после чего они переводятся из декартовых координат в полярные (радиус и угол). Распределение углов оказывается предсказуемым и сконцентрированным, поэтому нормализация и хранение дополнительных констант становятся больше не нужны.
На втором этапе подключается QJL, метод на основе преобразования Джонсона-Линденштраусса, который кодирует остаточную ошибку первого этапа всего одним знаковым битом и через встроенную оценочную функцию сочетает высокоточный запрос с низкоточными сжатыми данными, корректно вычисляя attention score.
Ни один из методов не требует обучения или дообучения и работает в режиме "без предварительного анализа набора данных".
Алгоритмы тестили на бенчмарках для длинного контекста: LongBench, Needle In A Haystack, ZeroSCROLLS, RULER и L-Eval с моделями Gemma и Mistral.
При квантовании KV-кэша до 3 бит TurboQuant показал нулевую деградацию точности на всех задачах: поиск «иголки в стоге сена», QA, генерация кода, суммаризация.
Объем KV-кэша при этом сократился в 6 раз. На H100 четырехбитный TurboQuant ускорил вычисление attention-логитов до 8 раз по сравнению с 32-битными ключами.
Область применения не ограничивается KV-кэшем. В экспериментах с высокоразмерным векторным поиском TurboQuant стабильно превзошел по recall методы PQ и RaBitQ несмотря на то, что те использовали крупные код-буки и подстройку под конкретный датасет.
🟡Статья
🟡Arxiv
@ai_machinelearning_big_data
🎯Полезные Мл-ресурсы🚀Max
#AI#ML#LLM#TurboQuant#Google
Глубокое обучение для поиска промышленно-научных изображений (например, изображений горных пород)
Допустим у вас есть база данных микроскопических изображений горных пород с измеренными физическими свойствами. Эта база данных постоянно пополняется. Вы берете новое изображение и хотите 1) найти подобные из миллиона других и 2) оценить физические свойства найденного изображения без дополнительного физического эксперимента.
Вот примерно это попытались сделать ученые из Shell в статье Content-based image retrieval for industrial material images with deep learning and encoded physical properties 🔥
Они обучили свою кастомную нейронную сеть оценивать похожесть изображений горных пород, используя сиамские нейронные сети. В дополнение к этому, они натренировали сеть оценивать похожесть мета-данных, например какая пористость или проницаемость, присуща именно этому изображению.
В результате получилась история как на картинке -> подаем изображение с измеренными физическими свойствами -> получаем максимально похожие изображение с оцененными физическими свойствами. На картинке 2 желтый - резульатат при использовании архитектуры ResNet-34, фиолетовым - архитектура предложенная авторами. Результат конечно в пользу последней.
Авторы предлагают использовать данный подход для всех типов промышленных и научно-исследовательских изображений.
Статья📖
Код💻
#paper#ML#AI#Earth
🇬🇧#UK
#PreCrime
"I WAS MISIDENTIFIED AS SHOPLIFTER BY FACIAL RECOGNITION TECH"
Sara needed some chocolate - she had had one of those days - so wandered into a #HomeBargains store.
"Within less than a minute, I'm approached by a store worker who comes up to me and says, 'You're a thief, you need to leave the store'."
Sara - who wants to remain anonymous - was wrongly accused after being flagged by a facial-recognition system called #Facewatch.
She says after her bag was searched she was led out of the shop, and told she was banned from all stores using the technology.
Facewatch later wrote to Sara and acknowledged it had made an error.
The #MetropolitanPolice in #London say that around one in every 33,000 people who walk by its cameras is misidentified.
But the error count is much higher once someone is actually flagged.
One in 40 alerts so far this year has been a false positive
#AI
#FacialRecognition
• #пост@syriafirst
• #новости@syriafirst
• #фото@syriafirst
• #история@syriafirst
• #видео@syriafirst
• #армия@syriafirst
• #инфографика@syriafirst
• #мем@syriafirst Сирия — благословенная земля, настоящая колыбель цивилизации, «бьющееся сердце Арабского мира»😇
☝🏻 Одной поездки в эту страну всегда оказывается мало.
• Это каменистые пустыни, цветущие долины Евфрата и сады удивительно живописных гор.⛰
• Это крепости крестоносцев и замки Саладина, это километры средневековых базаров Дамаска — подлинной «розы Востока». 🌺
• Это гигантские развалины античных городов и пляжи солнечного берега Средиземного моря.
Сирия — целый легендарный ошеломляющий мир, с очарованием ослепительного блеска.✨
Здесь начинались традиции восточного гостеприимства. С далёкого прошлого сирийцы всегда знали, как обратить незнакомцев в друзей.
Мархаба!
Добро пожаловать в Сирию 🤗
Поехали с нами 💫
(7 ночей)
🏨 Проживание в отеле по программе
💲 Стоимость от 1 850 долл с человека
В стоимость включено:
✅ Проживание в отелях 4-5 по программе;
✅ Бутылка воды в день на протяжении всего путешествия;
✅ Трансферы по программе на комфортабельном минивене;
✅ Все входные билеты согласно маршрута;
✅ Работа русскоговорящего гида;
✅ Помощь с оформлением визы;
✅ Пограничный налог
Мы искренне надеемся, что уникальность Сирии поможет вам полюбить её с первого взгляда ❤️