В Linux стандартными средствами можно использовать часть оперативной памяти как диск. Для этого требуется указать тип монтирования tmpfs в команде mount
mount -t tmpfs -o size=5G tmpfs /mnt/ram
Теперь путь /mnt/ram можно использовать как обычный каталог. Для чего это может быть нужно?
▫️ Скорость работы с таким каталогом выше чем многие SSD и тем более HDD.
▫️ Если у вас очень быстрый SSD на NVMe M.2 то такой способ особо не прибавит вам скорости, но поможет сохранить ресурс SSD когда требуется обрабатывать очень много мелких файлов и оперативка позволяет выделить нужный объем.
▫️ Оперативка это энергозависимая память, поэтому выключении питания все файлы безвозвратно теряются. Такой "non persistent" каталог гарантирует удаление временных файлов.
Я написал небольшой скрипт для условного теста и сравнения скорости копирования файлов между SSD и RAM.
Вот мои результаты:
Single File Size: 30.0Gb
ssd > ssd: 0:00:12.850 / 2.3Gb/s
sdd > ram: 0:00:06.453 / 4.6Gb/s
ram > ram: 0:00:06.995 / 4.3Gb/s
ram > sdd: 0:00:06.217 / 4.8Gb/s
Dir size: 32.7Gb, File count: 11127
ssd > ssd: 0:00:15.063 / 2.2Gb/s
sdd > ram: 0:00:08.486 / 3.9Gb/s
ram > ram: 0:00:08.032 / 4.1Gb/s
ram > sdd: 0:00:07.026 / 4.7Gb/s
Скрипт для теста ↗️
На моём железе прирост скорости ~2x. Плюс экономия ресурса SSD.
В Windows такой фишки по умолчанию нет, но обязательно найдутся аналогичные решения
#linux#triks
🤖Rtutor.ai для работы с вашими данными с помощью запросов на естественном языке
Steven Ge написал приложение RTutor, которое позволяет генерировать и тестировать код на языке R, просто "общаясь" с ним. Например, на основе набора данных mpg можно задавать такие вопросы: "С помощью ggplot2 создай боксплот (boxplot) для зависимости hwy от класса. Цвет по классам. Добавь джиттер" (Use ggplot2 to create a boxplot of hwy vs. class. Color by class. Add jitter).
RTutor сгенерирует функциональный код для ответа на ваш вопрос, что упрощает проведение предварительного анализа и визуализации данных для тех, кто не имеет опыта работы с R. Тем же, кто имеет опыт работы с R, RTutor поможет сэкономить время, предоставляя код, который можно использовать в качестве отправной точки для своих проектов.
RTutor может быть запущен локально как пакет R. Он также генерирует код R в формате Markdown и html-отчеты.
#R#ggplot2#AI#chatGPT
«Основы визуализации данных» Клауса Уилке
Наконец-то вышел русскоязычный перевод книги Клауса Уилке «Основы визуализации данных» — это настоящая кладезь знаний для всех, кто хочет овладеть искусством и наукой визуализации данных. Автор, профессор интегративной биологии, обладает уникальной способностью объяснять сложные концепции простым и доступным языком, что делает книгу полезной как для новичков, так и для опытных специалистов.
С самого начала Уилке подчеркивает важность правильного отображения данных. Он отмечает, что визуализация данных — это не просто способ сделать отчеты более красивыми, но и мощный инструмент для анализа и коммуникации, способный существенно повлиять на интерпретацию информации. Автор проводит читателя через все этапы создания визуализации, от выбора правильного типа диаграммы до настройки осей и использования цветовых схем.
Одним из главных достоинств книги является ее структурированность и систематичность. Каждая глава посвящена отдельному аспекту визуализации, начиная с базовых принципов и заканчивая более сложными техниками. Например, глава, посвященная цветовым схемам, предоставляет исчерпывающие рекомендации по выбору и использованию цветов, учитывая как эстетические, так и функциональные аспекты. Уилке подробно объясняет, как различные цветовые схемы могут влиять на восприятие данных и как избежать распространенных ошибок, таких как чрезмерное использование цветов или недостаточное внимание к людям с дальтонизмом.
Большое внимание уделяется также выбору правильных типов диаграмм для различных типов данных. Автор приводит множество примеров, показывая, какие визуализации наиболее эффективны для представления количественных, категориальных или временных данных. Практические советы и примеры помогают читателю лучше понять, как применять теоретические знания на практике.
Все графики в книге подготовлены с помощью R и ggplot2, но вы не найдете ни строчки кода в книге. Можно отдельно посмотреть код самой книги, так и отдельных графиков.
Похвалы заслуживает глава, посвященная распространённым ошибкам в визуализации данных. Уилке подробно разбирает типичные ошибки, такие как избыточное использование трёхмерных графиков или отсутствие контекста, и предлагает практические решения для их избегания. Это делает книгу не только учебным пособием, но и ценным справочником, к которому можно обращаться в процессе работы.
В целом, «Основы визуализации данных» Клауса Уилке — это обязательное книга для всех, кто работает с данными и хочет научиться представлять их максимально эффективно и понятно. Книга сочетает в себе глубокие теоретические знания и практические советы, что делает её незаменимым инструментом для анализа и визуализации данных. Она помогает не только создавать красивые графики, но и делать ваши данные понятными и убедительными, что особенно важно в эпоху информационного перегруза.
#книги#dataviz#R#ggplot2#ВизуализацияДанных
🤖Краш-тест возможностей chatGPT-4 для создания визуализации данных в R с помощью ggplot2
GPT-4 можно использовать для улучшения визуализации данных в R (ggplot2), что делает его отличным инструментом как для начинающих, так и для продвинутых пользователей R. Мне понравилось, как автор видео общается с chatGPT-4. Хотя код на R иногда содержит ошибки и не работает, весь процесс выглядит очень захватывающим. От создания базовых графиков (смотрите с какой легкостью chatGPT пишет код для пайчарта 🙊 на зависть новичкам) до продвинутых техник использования ChatGPT для поиска данных, анализа и визуализации данных.
▶️ВидеоUsing GPT-4 for Data Viz (R/ggplot).
Мораль: Как мне кажется, с появлением AI люди НЕ потеряют способность к абстрактному мышлению, анализу, или креативность. Использование chatGPT только повысит производительность труда и качество работы человека.
#R#ggplot2#chatGPT4#визуализация_данных#dataviz#полезное