TGINSIGHT CHAT
Чартомойка
@chartomojka
КриптовалютыО графиках: плохих, хороших и других. От восхищения до ненависти — один chart. Заметили подозрительный график, присылайте — @bogachev11
Последние посты
Стр. 4 из 84 · 1,006 постов
Опубликован 29 окт.
Ну, и последний важный тейк. Важно отличать всё вышеперечисленное от картодиаграм (proportional symbol map), где показатель кодируется (как правило) площадью кружочка или квадрата, который ставится либо на какую-то точку (город), либо в центр (центроид) полигона. Собственно в этом их отличие от непрерывных анаморфоз. Потому что бывают непрерывные анаморфозы (contiguous cartograms), которые сохраняют топологию, но искажают форму, и раздельные (разобщенные) анаморфозы (non-contiguous cartograms), которые сохраняют форму, создавая при этом зазоры между областями. И их отличие от картодиаграмм, где символы размещаются в центре каждой области в том, что анаморфозы масштабируют всю территорию целиком.
Опубликован 29 окт.
Причем анаморфоза может выглядеть достаточно сильно по-разному. Главный принцип — изменение площади для кодирования показателя. (вторую поставил по ошибке. это proportional symbol map — пузырьковая (или в данном случае - квадратичная(?) картодиаграмма — всё же)
Опубликован 29 окт.
Уже писал об этом, но давно. Но постоянно вижу эту ошибку. Поэтому повторяю. Традиционно в России cartogram ошибочно переводят как картограмма. Хотя всё ровно наоборот. Это НЕ картограмма, а анаморфная карта (анаморфоза), где показатель кодируется площадью географической фигуры. А на картограмме показатель кодируется цветом или оттенком цвета, которым фигура закрашивается. Только вот по-английски картограмма — choropleth map. Пожалуйста, не повторяйте эту ошибку. — P.S. На первой картинке по-видимому сделано и то, и другое. То есть показатель кодируется и площадью фигур и цветом заливки.
Как можно сделать лучше? Накидала быстренько несколько вариантов, как иначе можно визуализировать эти данные (да-да, будут столбики🤓) Линейчатая с накоплением прекрасно будет работать с этими данными. У нас есть части, которые в сумме дают 100% (вложенный характер) и в каждой группе мы смотрим доли каких ответов преобладают или нет. Можно выделить все категории, а можно сделать точечный акцент на основной идее, остальные ответы залить серым. Можно вполне уйти в столбиковую с группировкой и полосовую. Здесь еще решила немного переиграть сам набор данных, чуть укрупнила "хвост из мелочевки". Дальше расставляем акценты, добавляем все подписи, доп.комментарии. Ну и решила все-таки вынести на общее обозрение вариант с вафлей. Понятно, что многие значения близки и она не так визуально эффективна, но основную мысль вполне себе выделяет и разницу в некоторых интересных моментах тоже. Можно также выделять цветом не все ответы, а зацепиться за идею, остальное оставить серым. Я еще пробовала варианты "с кругами", но из-за того что значения многие близки, смотрится все примерно одинаково, сложно сравнивать и различать #Разборыдиаграммы
Hashtags
Когда форма ради формы Разберу простой пример, но очень показательный, уже не раз с подобным сталкивалась. Посмотрите на эту визуализацию. Вроде бы все есть: проценты, подписи, цвета. Но считывать информацию как-то долго и неудобно. Почему? Потому что форма ради формы. Авторы решили подать данные в виде капель. Выглядит может даже "креативно", но визуально совершенно бесполезно: - площадь каждой капли ничего не означает (если я совсем не ослепла🫠) - сравнить значения между строками затруднительно - мозгу приходится каждый раз "читать цифры", а не воспринимать форму, которая бы соответствовала значению и передавала бы его. То есть визуализация перестала быть визуализацией - стала просто декоративной картинкой. Форма должна помогать понять данные, а не прятать их. Когда мы в визуализации видим круги, капли и т.п., то мы автоматически ищем смысл в размере, форме, цвете. А если смысла там нет, то такая "визуализация" начинает только все усложнять и запутывать аудиторию. К чему это все, а чтобы напомнить (побуду занудой): - красота визуализации не в необычной форме, а в ясности передачи смысла - форма может быть нестандартной, но она должна передавать смысл, эмоции, посыл. Если форма не помогает понять данные, ничего не доносит, то от нее стоит отказаться - лучше "простая и понятная" диаграмма, чем "красивая, но бесполезная". Не топите данные под формой. Визуализация должна быть в первую очередь все-таки про данные, про смысл, особенно, в бизнес-среде (да и не только). Как можно сделать лучше?⬇️⬇️⬇️ #Разборыдиаграммы
Hashtags
Довольно необычные и при этом на удивление наглядные графики из свежего материала NYT про женскую лигу NBA. Идея сводится к тому, что лига зарабатывает очень много, а баскетболистки непропорционально мало, особенно в сравнении с баскетболистами NBA. И тот, и другой график — чуть додуманные графики из знакомых. Буллет-чарты, в которые добавили ещё один уровень вложенности (плюс остроумно расположенные подписи) и.. range chart, но перевернутый на 90 градусов и фактически small multiples для сравнения текущих и возможных доходов. #датавизприемы
Hashtags
Ну что ж, пришло время поделиться своим вариантом ответа на вчерашнюю головоломку. Как справедливо отметили в комментах данные какие-то странные и непонятные сходу. Вроде бы говорится про "изменение" и ты ждешь "плюс сколько-то процентов" или "минус сколько-то", и вроде бы проценты и есть. Но на самом деле.. это обман. Это не проценты изменения, а просто результаты опроса. Вторая хитрость. Изменилось отношение — не изменилось. Как будто бы это довольно разные группы, и хочется на этом сделать акцент. На том, что у большинства китайцевладельцев именно изменилось отношение. И мы не знаем какое оно было (а если бы знали, можно было сделать санкей, например, кто из какой группы в какую перетек), но скорее всего оно было хуже. В общем, пытаясь учесть все эти нюансы, собрал вот такую визуализацию. И да, у нее еще есть потенциал для апгрейда, но разобраться в ней проще, чем в исходной таблице. И большой привет тем, кто утверждает, что таблички меньше 15-20 строк вообще визуализировать не надо. #разборыграфиков
Hashtags
Опубликован 2 окт.
Нашел сложную задачку, над которой было приятно поломать голову. Коллега прислал вот такую табличку. Перепробовав несколько вариантов переделки, пришел к своему решению. Но поделюсь им через несколько дней. Кому интересно, кидайте в комменты свои идеи, потом сверимся. Датасет в первом комменте.
Опубликован 1 окт.
Я сделал свой плагин для визуализации данных в Figma! Сразу о главном: найти его можно тут. А в качестве иллюстрации — две версии графика, которые с помощью него были сделаны. 🔗 Это Лёша, дата-журналист, автор проекта @data_csv, а теперь ещё и разработчик плагина data-viz.me. Я уже восемь лет визуализирую данные, и заметил вот какую вещь: Самые красивые графики в большинстве случаев дизайнеры дорабатывают в графическом редакторе. Меняют шрифты, добавляют иллюстрации и кастомные подписи. Однако перенос графика из программ для визуализации в векторные редакторы — это всегда немножко пытка. Ты удаляешь кучу каких-то масок и лишних слоёв. Не всегда можешь поменять размеры. Тексты разбиваются на несколько блоков. Пережить можно, но хотелось бы проще. Вот уже много лет я думаю — было бы славно, если графики можно было бы рисовать инструментами Фигмы. Но почему-то за все эти годы там не появилось хороших плагинов для визуализации. Я постараюсь эту нишу закрыть. 🔗Важно: пока это alpha-версия с урезанным функционалом. Можно сказать, что это самый продвинутый генератор столбиков во всём Figma Community 😄 Что можно сделать на текущий момент: ➡ Загрузить таблицу из Google Sheets, файлом или текстом. Загрузка из Google Sheets иногда может тупить из-за нагрузки на сервер-парсер. Я обычно просто копирую таблицу ➡ Выбрать разделитель и форматирование для чисел ➡ Построить по ним вертикальные столбики ➡ Задать столбикам gap в процентах от их высоты ➡ Раскрасить по категориям — пока только по стандартным палитрам, но в будущем функционал расширится ➡ Убрать подписи. Или добавить в них любую колонку ➡ Выбрать любой шрифт! Написать заголовок, подзаг и источник, подобрать к ним любые цвета и форматирование ➡ Подобрать любой размер и отступы от границ фрейма Многого пока нельзя. Сжальтесь! До релиза пришлось жёстко отсекать фичи, чтобы плагин работал стабильно. Но подозреваю, что багов по-прежнему много — о них можно писать в комьюнити. 🔗Я планирую делать плагин полностью бесплатным. Очень надеюсь, что он станет востребованным, и в том числе мы сможем использовать его для обучения студентов визуализации. Однако в разработку уходит много моих сил. А ещё — приходится оплачивать курсор для разработки. И если вы считаете это начинание важным, поддержите проект донатами. P.S. На обложке плагина — работа моей коллеги Нади АндриановойOne Week in Sound. Надя, спасибо за красоту и что разрешила её использовать 🥺
Опубликован 15 сент.
☝🏻История про пост Бирмана оказалась еще забавнее, чем казалось сначала. Я вообще не мог понять логику, которую автор использовал в своем посте, настолько она выглядела абсурдной. Но всё выяснилось, когда Игорь Яновский (который написал прекрасный пост про Тафти, его я прокомментирую позже) прислал мне скрин страницы из книги Тафти Visual explanations. Итак, давайте почитаем, что пишет Тафти и о чем этот пример. Наконец, несмотря на хроническую опасность искажения, корректные преобразования масштабов являются одними из самых мощных стратегий исследования данных. В двух- и трёхмерных изображениях часто бывает полезно видеть изображения и объекты примерно одинакового или меньшего, чем реальный, размера. [Перед этим он возмущается роликом, где показали красивый пролет по Венере, где высота гор была для красоты увеличена в 22,5 раза] Например, рассмотрим это полезное решение (разработанное Уильямом Кливлендом) для проблемы отношения сторон в статистических отображениях. График справа показывает количество солнечных пятен по годам с 1749 по 1924 год, следуя известному 11-летнему циклу. Но в этих данных есть гораздо больше, чем просто ритмы и формы. Идея Кливленда — выбрать соотношение сторон так, чтобы наклоны выбранных отрезков линий центрировались вокруг угла в 45°, техника, реализуемая с помощью итеративных вычислений. Применение этого метода к данным о солнечных пятнах даёт график внизу справа, который показывает, что циклы имеют тенденцию быстро расти и медленно спадать. Это поведение наиболее выражено для циклов с высокими пиками, менее выражено для средних пиков и отсутствует для циклов с низкими. Пример прекрасный, и ИМЕННО ДЛЯ НЕГО этот подход действительно работает. Но почему? Да потому, что здесь: 1) очень много точек 2) ритмичные колебания 3) большая амплитуда регулярных изменений. В этом случае, конечно, вытягивать график по высоте не стоит. Но это не "Тафти рекомендует подбирать вертикальный масштаб так, чтобы в среднем угол наклона графика к горизонту был примерно равен 45°". Более того, это не Тафти, а Кливленд, и он тоже это не рекомендует, а это одна из "стратегий исследования данных". Более того, Тафти говорит прямо противоположное — корректные преобразования масштабов являются одними из самых мощных стратегий исследования данных. Вообще, я бы сказал, что это один из довольно редких в реальном мире примеров. И на практике, если мы говорим, про медиа и публикацию, график нужно было либо пропорционально растянуть по горизонтали, потому что он получился очень мелкий и его сложно читать. Либо порезать время на кусочки и положить один кусочек под другим. И да, действительно, пропорции под 45 градусов в этом случае позволяют удобно считывать характер нарастания или снижения показателя при ритмичных колебаниях. А если на графике будет один пик? А если два, но отличающиеся вдвое? В примере же Бирмана, и это вызвало мое изначальное недоумение, нет никакой существенной разницы между двумя графиками в абстрактном смысле. То есть чтобы сказать, что нужно выбрать, левый или правый — нужно понимать природу этих данных, о чем и шла речь изначально. (и кстати 45 градусов скорее у первого из графиков)
Опубликован 15 сент.
Опубликован 12 сент.
У рассылки «Это не показатель» — новый формат! Вместе с приглашенным экспертом мы разбираем графики подписчиков 🔸Как это работает. Мы даем данные и контекст, вы — строите график. Работы прокомментируем вместе с Александром Богачевым — автором книги «Графики, которые убеждают всех» и телеграм-канала «Чартомойка». 🔸Что нужно сделать: Скачать данные, построить график и выложить его в комментариях к этому посту до 14.09 включительно. Через три дня мы выберем и подробно разберем первые пять графиков. Обратная связь тоже будет в комментариях. 🔸Что за данные: Это статистика Росстата о доле новорожденных в России по гражданству матери и отца. В таблице 8 столбцов: первый — год, три с приставкой father_ — гражданство отца (от конкретной страны до укрупнённых категорий), три с приставкой mother_ — гражданство матери. Последний столбец — доля рождений конкретной комбинации гражданств в данном году. Важно помнить: речь только о гражданстве родителей, эти данные не отражают этническую принадлежность. Все графики мы разберем в закрытом канале рассылки. Хотите больше таких заданий и разборов от команды и экспертов? Подписывайтесь на рассылку за 500 ₽ в месяц.