TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #273 · 28.03

Недавно, как вы знаете, был большой скандал со сливом данных кучи пользователей из Яндекс Еды. Самое неприятное, пожалуй, что утекли адреса людей с точностью до квартиры. У меня почти всех друзей затронуло так или иначе (и меня самого тоже). Сам слив, как говорят, был вызван саботажем изнутри на фоне последних событий. Независимо от того, какую цель преследовал злоумышленник, навредил он этим всем: адепты любой из сторон конфликта смогут воспользоваться данными для нанесения ущерба своим противникам. Вина самого Яндекса в утечке представляется мне не очень высокой. Не будет же компания проводить в своих рядах идеологическую проверку, а по её результатам увольнять и лишать доступа. Но в статьях с анализом в основном винят Яндекс за сам факт хранения данных. Видел хорошее объяснение на эту тему: штраф за утечку мизерный, а хранение данных бизнесу выгодно, это может принести прибыль в дальнейшем, даже если прямо сейчас данные не нужны. К тому же, чисто технически сложнее сделать так, чтобы правильно понимать, какие данные оставлять, а какие нет, чем просто тупо записывать всё подряд. Так что это вопрос цифр: "дешевле" хранить, чем не хранить. Другое дело, как это всё используется. Вчера заказал продукты в Лавке, и мне в заказ положили рекламную "симкарту" от Мегафона. Я не знаю, сколько стоит Мегафону одна такая реклама, возможно, очень дёшево, и поэтому за ней никак не следят. Ведь Лавке совершенно точно известно, что я и так являюсь клиентом Мегафона. Они буквально только что доставили мне этот самый заказ по моему аккаунту, где указан мегафоновский номер. #life

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #visualisation

当前筛选 #visualisation清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8262 · 13.08.2025 г., 13:04

🌟Embedding Atlas: визуализация структуры эмбедингов прямо в браузере. Embedding Atlas — опенсорсный инструмент от Apple для интерактивной визуализации больших наборов векторных представлений, который позволяет не просто смотреть на облако точек, а полноценно с ним работать. И что самое приятное, он способен отрисовывать до нескольких миллионов точек благодаря реализации на WebGPU. 🟡Автоматическая кластеризация и разметка данных. Embedding Atlas сам находит скопления в данных и подписывает их, позволяя мгновенно сориентироваться в общей структуре датасета. Чтобы отделить реальные кластеры от случайных выбросов, используется оценка плотности ядра с отрисовкой контуров плотности. Решена и вечная проблема визуализаций - "каша" из перекрывающихся точек. Embedding Atlas использует технологию order-independent transparency, так что даже при большом наложении точек картинка остаётся четкой и информативной. 🟡Интерактивность. В инструменте есть поиск в реальном времени и нахождение ближайших соседей. Можно ввести текстовый запрос или просто кликнуть на любую точку в облаке, и Embedding Atlas мгновенно подсветит наиболее похожие на нее данные. Еще есть интерактивный фильтр по метаданным. Например, можно выбрать на гистограмме определенный класс объектов, и визуализация тут же отфильтрует эмбединги, оставив только соответствующие ему точки. 🟡Embedding Atlas поставляется в виде 2 пакетов: 🟢Python-пакет Дает три варианта интеграции: утилиту командной строки для быстрой визуализации датафреймов, виджет для Jupyter, позволяющий встраивать атлас прямо в ноутбуки, и компонент для Streamlit, если вы создаете полноценные веб-приложения. 🟢Npm-пакет Этот пакет для тех, кто хочет встроить визуализацию в собственные веб-приложения. Он предоставляет готовые UI-компоненты в виде API: Table, EmbeddingView, EmbeddingViewMosaic и EmbeddingAtlas. 📌Лицензирование: MIT License. 🟡Страница проекта 🟡Документация 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Embedding#Visualisation#Apple