Громкий скандал в уютном мирке искусственного интеллекта.
По данным технических изданий, в поисковых системах Google, Bing и DuckDuckGo были обнаружены ссылки на сотни тысяч диалогов пользователей с языковой моделью Grok, разработанной компанией xAI Илона Маска. Установлено, что активация функции «поделиться» в интерфейсе чата автоматически генерирует уникальный URL-адрес, который, согласно отчетам, индексируется поисковыми системами без прямого уведомления пользователей.
При этом никто и никогда не обещал пользователям Grok, что их диалоги с искусственным интеллектом останутся конфиденциальными.
По информации аналитиков, Google проиндексировал более 370 тысяч таких диалогов. Среди них — запросы, связанные с медицинскими и психологическими темами, включая конфиденциальные вопросы, а также персональные данные пользователей. В одном из случаев в чате был опубликован пароль, переданный Grok. Кроме того, в некоторых диалогах содержались инструкции, сгенерированные моделью, по изготовлению запрещенных веществ и взрывных устройств.
Компания xAI пока не предоставила официальных комментариев по этому поводу. Однако в конце июля 2025 года в поисковой выдаче Google были обнаружены аналогичные ссылки на чаты с ChatGPT, разработанным OpenAI. Представители OpenAI пояснили, что это произошло из-за временного эксперимента с функцией обмена ссылками, и сообщили, что данная возможность была оперативно отключена. В свою очередь, аккаунт Grok в социальной сети X ранее заявлял, что их система не поддерживает функцию автоматического создания общедоступных ссылок на чаты.
В 2024 году объем мирового рынка ИИ достиг 184 миллиардов долларов, и с ростом популярности чат-ботов вопросы конфиденциальности становятся все более актуальными. Пользователям рекомендуется избегать передачи чувствительной информации в диалогах с ИИ до внедрения более надежных механизмов защиты данных. Однако, очевидно, что преимущества общения с ИИ затмевают возможные риски, о которых пользователи просто не задумываются.
Между тем сам объем диалогов человека с ИИ является ценной поисковой информацией, а также базовой информацией для развития и обучения самих ИИ.
#ии#ai#поиск#google#grok#xai#chatgpt#openai
Небольшая серия постов для квалификации на нейробаттл (а условия всё жестче! 🥺)
1 - Фантастический сюжет с мужчиной и женщиной
By Voodoont
#SciFi
#Romance
#voodoont
#арт#art#illustration#ai#stable_diffusion#realistic#anime#girl
YouTube Requires Disclosure for AI-Generated Content
YouTube is mandating creators to disclose when realistic content was generated by AI, particularly if it could be mistaken for depicting real people or events.
Creators must indicate the use of Generative AI in videos that viewers might confuse as genuine, such as deepfake speeches or synthesized media.
Even without disclosure, YouTube may label content containing synthetic elements, especially if it has the potential to mislead or confuse viewers, with more prominent labels for sensitive topics like elections or health.
However, the rules exclude content deemed "clearly unrealistic," like animations or fantasy scenarios, and production assistance using generative AI or beauty filters does not require disclosure.
YouTube is also working on a better process for users to request the removal of deepfakes, aligning with its guidelines on AI-generated music content introduced last August.
#YouTube#AI#Deepfakes#SyntheticMedia
🚀 ChatGPT становится проактивным
OpenAI продолжает удивлять! Альтман вчера анонсировал запуск новой функции ChatGPT Pulse для мобильного приложения, фактически автономного персонального и проактивного помощника.
Что такое Pulse?
Представьте,что пока вы спите, ваш виртуальный ассистент уже работает. Ночью ChatGPT анализирует ваши чаты, интересы, подключённые сервисы (например, Gmail или календарь) и последние события, чтобы к утру подготовить для вас персонализированную сводку на день .
Как это работает?
Утром в приложении вас ждёт набор визуальных карточек(от 5 до 10), которые можно быстро пролистать или изучить подробнее . Это не просто новости. ИИ собирает именно то, что считает полезным лично для вас:
➡️Напоминания и планы: идеи для повестки встреч из календаря, напоминание о днях рождения .
➡️Персонализированные советы: если у вас есть питомец — советы по уходу; если недавно болели — рекомендации по восстановлению .
➡️Актуальная информация: подборка новостей по интересующим вас темам, например, о любимой спортивной команде .
Вы можете настраивать контент, отмечая бесполезные карточки или сообщая ChatGPT о регулярных событиях (например, о тренировках по пятницам), чтобы рекомендации становились точнее .
Важные детали:
➡️Доступ: Pulse запущен 25 сентября 2025 года и на первом этапе доступен в preview-режиме только для подписчиков дорогого тарифа Pro ($200/мес) .
➡️Планы: OpenAI уже заявила о намерении со временем сделать функцию доступной для владельцев подписки Plus, а в перспективе — и для всех пользователей .
➡️Философия: Важный штрих — Pulse сознательно ограничивает количество карточек сообщением «Отлично, на сегодня это всё», чтобы не превращаться в бесконечную ленту, затягивающую внимание, как соцсети .
Pulse — это яркий пример сдвига в сторону асинхронных ИИ-продуктов, которые работают на вас самостоятельно, а не просто отвечают на вопросы . Будущее, где персональный искусственный интеллект доступен каждому, становится ближе.
Я пока не очень готов, чтобы ИИ начинал диалог первым. А вы?
#ChatGPT#Pulse#OpenAI#ИскусственныйИнтеллект#ИИ#НовостиИИ#AI
https://t.me/semasci
🌟OMC25: датасет для вычислительной химии.
ОMC25 - крупнейший набор данных по молекулярным кристаллам, рассчитанный методом теории функционала плотности (DFT) в пакете VASP.
В основе датасета лежат структуры, полученные из траекторий релаксации молекулярных кристаллов. Сами исходные кристаллы были сгенерированы с помощью инструмента Genarris 3.0, который, в свою очередь, использовал молекулы из известного набора OE62. Это обеспечивает преемственность данных и четкую привязку к проверенным химическим структурам, но масштаб здесь совершенно иной.
Тренировочная часть содержит почти 25 млн. фреймов. Это данные по 207 тыс. кристаллов, которые, в свою очередь, произошли от 44 тыс. уникальных молекул.
Валидационная часть меньше, но тоже весовая: около 1,4 миллиона кадров. Данные упакованы в формате ase-db как объекты LMDBDatabase, что является стандартом в задачах машинного обучения для химии.
Исходные кристаллы были созданы программой Genarris 3.0. Она, в свою очередь, использовала молекулы из популярного набора OE62. Так что у данных есть четкая привязка к проверенным химическим структурам.
Работа с данными сета происходит через библиотеку fairchem. Каждая структура хранится как объект ASE Atoms, что привычно для инженеров, работающих с атомистическим моделированием.
Ключевые метки для обучения моделей включают полную энергию DFT, силы, действующие на атомы, и тензор напряжений . Это "каноническая троица" для обучения межатомных потенциалов. Помимо физических величин, в атрибуте atoms.info зашиты критически важные метаданные.
Помимо самого набора, авторы выложили базовый чекпоинт eSEN-S, обученный на всём OMC25.
📌Лицензирование : CC-BY-4.0 License
🟡Датасет
🟡Модель
🖥GitHub
@ai_machinelearning_big_data
#AI#ML#Dataset#FAIR#Chemistry
Gait Secures $500K Funding
Gait successfully raised $500K in funding as of December 4, 2024. The platform focuses on storing, sharing, and understanding AI-codegen prompts.
#Funding#AI#CodeGeneration#TechNews#Startups
📌Анатомии GPU и TPU: 12 глава пособия "How to Scale Your Model"
Группа инженеров из Google DeepMind опубликовали 12-ю главу своего он-лайн учебника "How to Scale Your Model: A Systems View of LLMs on TPUs"
How to Scale Your Model - практико-ориентированное руководство по масштабированию LLM из 12 разделов для разработчиков и исследователей. Оно объясняет, как анализировать и оптимизировать производительность модели, учитывая системные ресурсы: вычисления, память и пропускную способность.
Пособие научит выбирать оптимальные стратегии параллелизма, оценивать стоимость и время обучения и инференса, а также глубже понять взаимодействие между TPU/GPU и алгоритмами масштабирования как на одном, так и на тысячах ускорителей.
12-я глава - глубокое техническое руководство по архитектуре GPU и стратегиям масштабирования больших моделей. В ней детально разбирается устройство современных GPU NVIDIA: Streaming Multiprocessors, Tensor Cores, иерархия памяти (HBM, L2, SMEM), все это с подробными сравнительными таблицами характеристик для разных поколений чипов.
Очень подробно выполнено сравнение архитектур GPU и TPU, с объясняем ключевого различия между модульностью GPU и монолитностью TPU.
Особое внимание, что редкость для обучающих материалов, уделено сетевой организации кластеров. Авторы доступно объясняют как GPU соединяются внутри узлов через NVLink/NVSwitch и между узлами через InfiniBand в топологии "Fat tree", и как пропускная способность на каждом уровне влияет на реальную производительность коллективных операций (AllReduce, AllGather).
Описаны основные стратегии параллелизма: Data Parallelism, Tensor Parallelism, Expert Parallelism и Pipeline Parallelism, с разбором их ограничений и примеров из реальных проектов.
В конце главы есть хороший анализ новых возможностей архитектуры Blackwell.
@ai_machinelearning_big_data
#AI#ML#LLM#Scaling#GPU#TPU