TGTGInsightаналитика telegramLIVE / telegram public index
← Коля Валиотти • Дата консалтинг
Коля Валиотти • Дата консалтинг avatar

TGINSIGHT POST

Post #154

@datakolya

Коля Валиотти • Дата консалтинг

Просмотры251Количество просмотров
Опубликован20 мая20.05.2024, 07:39
Содержимое поста

Содержимое

Дата-грамотность для чайников: типы данных Как обещал, начинаю рассказывать про дата-грамотность. Это тема обширная, и в одном посте все не охватишь. Начнем с самого простого и поговорим про то, как хранить данные в самых популярных табличных редакторах — Excel и Google-таблицах. ⭐️Для этого нужно учитывать, что существуют разныетипы данных Существуют числа, текст, проценты, даты. И каждой ячейке в Excel или Google Таблицах нужно выставить тип, который соответствует тем данным, которые в ней хранятся. ❗️ Почему это важно? Потому что иногда нам нужно, например, посчитать какие-то агрегированные показатели, суммы, средние, медианы. Если у нашей ячейки неправильно выбран тип данных, то мы не можем взять какой-то срез информации и посчитать агрегированную статистику. Например, если у нас числа записаны в виде текста. То же самое с датами. Потому что иногда может понадобиться посчитать что-то по месяцам или по годам. И когда ты четко понимаешь, что у тебя хранятся даты (и они записаны, как даты!), ты можешь использовать функции, которые работают с датами. ⭐️Данные надо разделять — числа с числами, текст с текстом Самая частая проблема, которую я видел, — это когда люди вбивают, например, цифры и ставят в ячейке пробел и дальше пишут какие-то текстовые символы. Ячейка сразу становится текстовой, и потом к ней нельзя применять формулы для работы с цифрами. ❗️Задача человека, который работает с таблицей, понять, что каждая строка — это отдельное наблюдение, у которого может быть несколько параметров Для примера представим, что у нас таблица с данными про группу из 10 людей. Каждый человек — строчка в таблице, а по столбцам мы можем хранить их параметры: вес, рост, цвет глаз, что-нибудь еще. Такая организация таблицы нам позволит по всем людям из класса посчитать средний рост, средний вес, максимальный рост, максимальный вес и так далее. Более того, мы можем сделать такую штуку, как сводная таблица, и в ней проводить более сложные вычисления. Например, посчитать средний рост людей, у которых зеленый цвет глаз. Мы можем решать аналитические задачи и строить, например, какие-то графики. Вот такие первые, самые базовые правила для тех, кто начинает свой путь с табличками. Скажите, было полезно или лучше рассказать про что-нибудь посложнее?