🌟Amazon встроила векторную базу данных прямо в хранилище S3.
Amazon анонсировала S3 Vectors - нативную поддержку векторного поиска прямо внутри своего вездесущего объектного хранилища. Заявлено, что это может снизить затраты на хранение и обработку векторов до 90%.
По сути, AWS предлагает не отдельный сервис, а новый тип бакета vector bucket. Внутри него вы создаете векторные индексы, указывая размерность векторов и метрику расстояния (косинусную или евклидову).
🟡Дальше все работает как магия
Вы просто загружаете в индекс свои эмбеддинги вместе с метаданными для фильтрации, а S3 берет на себя всю грязную работу по хранению, автоматической оптимизации и обеспечению субсекундного ответа на запросы. Никакого управления инфраструктурой.
Один бакет может содержать до 10 тысяч индексов, а каждый индекс, в свою очередь, десятки миллионов векторов.
🟡Главная сила этого решения - в экосистеме.
S3 Vectors бесшовно интегрируется с Bedrock Knowledge Bases. Теперь при создании базы знаний для RAG-приложения можно просто указать S3-бакет в качестве векторного хранилища.
Процесс создания RAG-пайплайна для тех, кто уже живет в облаке AWS, упрощается до нескольких кликов. То же самое касается и SageMaker Unified Studio, где эта интеграция тоже доступна из коробки.
🟡"One more thing" анонса - умная интеграция с сервисом OpenSearch.
AWS предлагает гибкую, многоуровневую стратегию. Нечасто используемые или «холодные» векторы можно экономично хранить в S3 Vectors. А когда для части данных потребуется максимальная производительность и низкая задержка в реальном времени, например, для системы рекомендаций, их можно быстро экспортировать в OpenSearch.
Это очень прагматичный инженерный подход, позволяющий балансировать между стоимостью и производительностью.
Пока сервис находится в статусе превью и доступен в регионах US East (N. Virginia), US East (Ohio), US West (Oregon), Europe (Frankfurt), and Asia Pacific (Sydney) Regions.
Попробовать S3 Vectors можно в Amazon S3 console.
🟡Статья
🖥Github
@ai_machinelearning_big_data
#AI#ML#RAG#Amazon
💰 Облачное подразделение корпорации Amazon — Amazon Web Services (AWS) — учредило фонд в размере $100 млн для финансирования собственных проектов, ориентированных на генеративный искусственный интеллект.
Программа AWS под названием «Центр инноваций генеративного ИИ» будет работать с клиентами над «созданием индивидуальных решений» под руководством стратегов, специалистов по данным, инженеров и архитекторов решений.
Согласно заявлению, основная цель компании заключается в «ускорении корпоративных разработок и развитии ИИ-технологий».
#Amazon
🌐Amazon рассматривает возможность создания веб-браузера на базе ИИ.
По данным Gizmodo, компания попросила пользователей пройти подробный опрос, чтобы «понять их предпочтения» в этой области. Он содержал различные вопросы, включая о важности функции преобразования текста в речь, расширений, возможности синхронизации данных между настольными и мобильными устройствами и блокировки сторонних файлов cookie.
#Amazon
🔊AmazonнаучилAlexa уведомлять пользователей о наличии перед входной дверью посылки или человека. Функция работает через камеры безопасности и видеодомофоны.
В случае обнаружения объектов голосовой помощник отправит пользователю оповещение на мобильное приложение, уведомит через динамик Echo или покажет прямую видеотрансляцию на Echo Show, Fire TV или планшете Fire. В ответ на это хозяин дома может включить освещение перед дверью, активировать интеллектуальный замок или запустить приветствие Alexa.
👀 Обнаружение посылок и людей доступно клиентам Ring с подпиской Ring Protect.
#Amazon
📦 Amazon задействует алгоритм для переключения работников между задачами, в которых используются разные части тела.
Так в компании намерены уменьшить количество травм среди складских сотрудников, большинство из которых, согласно опросу 2019 года, испытывали физическую боль во время выполнения работы.
✍️ Джефф Безос в своем последнем письме на посту CEO компании сообщил, что эта технология займет центральное место в программе ротаций рабочих мест. Он добавил, что Amazon намерена стать «лучшим работодателем на Земле» и «самым безопасным местом для работы на Земле».
Однако эксперты считают, что компании предстоит решить ряд проблем, прежде чем заслужить это звание. Ранее в СМИ появлялись сообщения о сотрудниках, не имеющих возможности воспользоваться ванной комнатой из-за жесткого тайм-менеджмента, высоком уровне травматизма, крахе профсоюзов и чрезмерном надзоре.
#Amazon
Polymathic - междисциплинарный ИИ
Ох, какая классная межуниверситетская инициатива - Polymathic🔥.
Задача, которую они решают, заключается в создании ИИ моделей, которые используют информацию из наборов данных различных модальностей и разных научных областей, которые не имеют общего представления (например, текста). Такие модели могут использоваться в качестве надежных базовых показателей или можно сделать файн-тьюнинг для конкретных приложений. Такой подход может демократизировать ИИ в науке, предоставляя более сильные априорные модели для общих концепций, таких как причинность, измерение, обработка сигналов, и т.п.
В общем история с базовыми и генеративными моделями понемногу адаптируется к научным задачам, за что мы топим тоже 🤘. Реальных проектов пока немного, но есть, например, Multiple Physics Pretraining - подход к разработке больших предобученных физических суррогатных моделей или AstroClip - видимо модель CLIP для астрофизиков.
На данный момент кроме команды ученых есть и крутой консультативный совет, например, с Яном Лекуном (Yann LeCun) из Meta AI.
#AI#ML
🗣 Исследование: Amazonиспользует голосовые данные Alexa для таргетинга рекламы, что противоречит политике конфиденциальности компании.
Американские ученые выявили, что техгигант и «третьи стороны» собирают информацию о взаимодействиях пользователей с ИИ-ассистентом через динамики Echo и делится ею с 41 рекламным партнером. Затем эти данные используются для «определения интересов людей» и «предоставления целевой рекламы на платформе (устройства Echo), а также вне платформы (интернет)».
Исследователи утверждают, что этот тип информации пользуется большим спросом и приводит к «30-кратному увеличению рекламных ставок со стороны рекламодателей». Также такой таргетинг подразумевает «значительный» обмен информацией между несколькими сторонами, добавили они.
🙅♂️ Согласно The Verge, Amazon применяет голосовые данные от взаимодействий с Alexa для информирования пользователей о релевантной рекламе на своих и сторонних сайтах. Также компания подтвердила наличие таргетированных предложений на умных устройствах. Однако техгигант опроверг продажу личной информации клиентов.
#исследование#Amazon
🤑Amazon Web Servicesвыиграла тендер стоимостью более $700 млн на предоставление облачных сервисов для ВМС США. Контракт рассчитан до декабря 2028 года.
В рамках сделки AWS предоставит Главному управлению ВМС доступ к коммерческой облачной среде, услугам экспертов, а также курсам по обучению и сертификации.
🗣 В ведомстве заявили, что контракт не обязывает передавать средства в момент заключения. Вместо этого оно планирует выделять капитал по мере выполнения заказов с использованием различных типов финансирования ВМС.
#США#Amazon
💬Alexa AIпредставила многоязычную нейросеть-трансформер AlexaTM с 20 млрд параметров. Модель способна изучать новые задачи по нескольким примерам и переводить их без вмешательства человека.
Алгоритм основан на архитектуре кодер-декодер. Для тренировки нейросети исследователи использовали комбинацию задач шумоподавления и каузально-языкового моделирования.
☝️ По данным разработчиков, AlexaTM превосходит аналоги в выполнении задач обобщения и машинного перевода, а углеродный след при ее тренировке составляет всего пятую часть от выбросов при обучении GPT-3.
#Amazon#NLP
🚀 20 августа 2025
Стартует RRNCB – Russian RAG Normative – Corporate Benchmark,
первый российский открытый бенчмарк для оценки RAG-решений при работе с нормативной,
правовой и технической документацией компаний.
Почему это важно?
✅ На рынке десятки RAG-решений, но нет методики и инструмента оценки и сопоставления характеристик RAG сервисов, оценить их качество очень трудно.
✅RRNCB – это первый продуктовый бенчмарк, цель которого провести комплексную оценку Retrieval augmented generation продуктов для работы с корпоративной и технической документацией.
✅ Специально создан для оценки систем, работающих с русскоязычными нормативами, кодексами, ГОСТами и корпоративными документами.
✅ Открытость и прозрачность: методики оценки и данные будут в открытом доступе.
Сравнение проходит по ключевым метрикам (ROUGE, LLM-судья, скорость, качество уточняющих вопросов).
Участие.
📋Приглашаем ИИ компании к участию в бенчмарке RRNCB со своими RAG-решениями и продуктами. Заполните заявку на участие.
В вашем распоряжении будут:
• Независимый лидерборд.
• Управление сабмитами.
• Возможность тестировать сабмиты до отправки в лидерборд.
• Разделение сабмитов на категории cloud и on-prem.
🗓Даты проведения:
Запуск: 20 августа
Регистрация RAG решений участников: до 3го сентября
Результаты: 20 сентября.
Почему стоит участвовать.
• Участие в открытом бенчмарке — это стратегическая инвестиция для владельца продукта.
Вы перестаете просто говорить, что ваш продукт «лучший». Вы доказываете это на объективных метриках в сложных, приближенных к реальности условиях. Это самый мощный аргумент для сомневающихся клиентов, который резко повышает доверие.
• Попадание в топ лидерборда — это готовый повод для PR.
• Реальные запросы и строгая оценка бенчмарка действуют как мощный стресс-тест. Выявляются проблемы, которые можно было не заметить на внутренних тестах.
• Результаты бенчмарка — это не просто цифры, а конкретные данные для вашей R&D-команды.
• Экономия ресурсов на собственном тестировании. Бенчмарк предоставляет инфраструктуру и датасеты готовыми, вместе с продуманной методологией оценки.
Подробнее о бенчмарке:https://fractalagents.ai/rrncb-rag-benchmark/
Инициатор проведения бенчмарка - ООО Аватар Машина.
#RAG#AI#RRNCB#Benchmark#ИскусственныйИнтеллект#OpenSource
#AI
Немного ИИ-теории
❗️В недавнем иске против компании OpenAI Илон Маск утверждал, что GPT-4 является ранним AGI, по сути равным человеческому интеллекту.
Что же такое AGI и когда он появится?
👤Сэм Альтман, CEO Open AI определяет AGI (artificial general intelligence) как интеллект, равный уровню обычного человека, который можно было бы принять в команду как сотрудника. Также популярно определение AGI как «системы, способной выполнить любую когнитивную задачу, доступную человеку».
📎Для справки: существует несколько видов (уровней развития) ИИ, а именно узкий ИИ (narrow, ANI), общий ИИ (genreal, AGI) и супер ИИ (super AI, ASI).
⏲Исследователи никак не могут прийти к консенсусу относительно даты появления AGI. По результатам Expert Survey on Progress in AI, существует 50% шанс того, что AGI появится до 2059 года. Тем не менее, поле ИИ изменяется постоянно и становится сложным оставаться в курсе событий.
⭐️Для этого мы нашли крупнейшее русскоязычное AGI-сообщество agirussia.org — у них есть канал и группа в Telegram.
🌐еще проходят еженедельные онлайн-семинары по тематике AGI на русском языке, записи семинаров за последние несколько лет доступны на YouTube и их сообществе в ВК.
Держим руку на пульсе ИИ⭐
⭐️Автор, Анна, @qcuqueen