Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML.
Из плюсов такого подхода стоит отметить вот что:
🔸 готовый, повсеместно используемый и поддерживаемый формат
🔸 простой и понятный файл, удобочитаемый для человека
🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек
Но есть и минусы
🔹 затраты времени при записи файла (кодирование данных в нужный формат строки)
🔹 затраты времени при чтении файла (декодирование данных в Python объекты)
🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...)
🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда)
🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные
Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи.
Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳.
🔸 очень быстрая запись
🔸 чтение значительно быстрей чем JSON, YAML итд
🔸 размер файла значительно меньше, так как нет разметки
🔸 можно записывать данные по мере поступления не загружая всё в память
🔸 можно извлечь любую часть данных независимо
Из минусов
🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата)
🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию.
🔹 не так-то просто создать такой файл без специальной библиотеки
В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии.
(Это не означает что нельзя записать данные разного типа, просто это будет не так удобно)
Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого
f15d cd29 a564 4578 ...
09e2 9bc4 a696 1253 ...
84e9 4de1 3b23 c24a ...
2534 5161 28e0 709d ...
...
Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла.
К чему это я? Читайте в следующем посте...
#tricks#basic
#CABI#тестовыйдоступ
РЦНИ информирует о том, что с 23 сентября по 22 ноября 2024 года открыт тестовый доступ к коллекции баз данных компании CAB International (CABI).
Подробная информация о ресурсе и порядок доступа опубликованы на сайте Национальная подписка.
Изображение от sergiorojoes на Freepik
#CABI#тестовыйдоступ
РЦНИ информирует о том, что до 13 сентября 2024 года открыт прием заявок на участие в тестовом доступе к коллекции баз данных компании CAB International (CABI).
Даты проведения тестового доступа с 23 сентября по 22 ноября 2024 года.
Подробная информация о ресурсе и форма заявки на участие в тестовом доступе доступны на сайте Национальная подписка.
Изображение от sergiorojoes на Freepik
#CABI#семинар#вебинар#тестовыйдоступ
Сегодня, 1 октября 2024 года, на площадке Центральной научной библиотеки имени Н.И. Железнова пройдет научный семинар, организованный совместно Отделом централизованной подписки Российского центра научной информации, ФГБОУ ВО «Российский государственный аграрный университет – МСХА имени К.А.Тимирязева» и компанией ООО «Дейтабейс100К20».
Приглашаем присоединиться к трансляции, которая начнется в 10:00 (мск).
Программа семинара доступна по ссылке.
Будем рады видеть Вас в числе участников семинара!
#CABI#семинар#вебинар#тестовыйдоступ
Отдел централизованной подписки ФГБУ «Российский центр научной информации», ФГБОУ ВО «Российский государственный аграрный университет – МСХА имени К.А.Тимирязева» и компания ООО «Дейтабейс100К20» приглашают принять участие в научном семинаре «CABI Digital Library – ключевой ресурс в области сельского хозяйства, окружающей среды и прикладных наук о жизни».
Семинар организован для поддержки тестового доступа, проводимого в рамках централизованной (национальной) подписки к коллекции баз данных компании CABI.
В работе семинара примут участие представители компаний CABI и Дейтабейс100К20, сотрудники Отдела централизованной подписки РЦНИ и Центральной научной библиотеки имени Н.И. Железнова, специалисты и преподаватели университета РГАУ-МСХА имени К.А. Тимирязева.
Дата проведения семинара: 1 октября 2024 года в 10:00 (мск)
Место проведения: ЦНБ имени Н.И. Железнова, РГАУ-МСХА имени К.А. Тимирязева
Программа семинара и форма регистрации доступны на сайте Национальная подписка.
#CABI#ЦНСХБ#семинар#вебинар#тестовый доступ
ФГБУ «Российский центр научной информации», ФГБНУ «Центральная научная сельскохозяйственная библиотека» и компания ООО «Дейтабейс100К20» приглашают принять участие в практико-ориентированном семинаре по ресурсу CABI Digital Library для сельскохозяйственных научных библиотек, аграрных научных и образовательных организаций.
Семинар организован для поддержки тестового доступа, проводимого в рамках централизованной (национальной) подписки к коллекции баз данных компании CABI.
В работе семинара примут участие представители компаний CABI и Дейтабейс100К20, сотрудники Отдела централизованной подписки РЦНИ и Центральной научной сельскохозяйственной библиотеки.
Дата проведения семинара: 8 октября 2024 года в 12:00 (мск).
Семинар пройдет в формате онлайн-трансляции.
Программа семинара и форма регистрации доступны по ссылке.
Будем рады видеть Вас в числе участников семинара!
#CABI#CEPIEC#CNKI#Questel#Orbit#SAGE#тестовыйдоступ
Российский центр научной информации напоминает, что продолжается приём заявок на участие в тестовом доступе к научным информационным ресурсам в рамках централизованной (национальной) подписки.
По ссылкам, приведенным ниже можно ознакомиться с описанием каждого ресурса и заполнить форму заявки для включения организации в перечень участников тестового доступа.
Электронные ресурсы в области сельского хозяйства и наук о жизни, социальных, общественных и естественных наук (приём заявок – до 13 сентября 2024 года):
⚫️CABI. Коллекция баз данных – содержит научную информацию в области сельскохозяйственных наук и наук о жизни.
⚫️CEPIEC. Коллекция полнотекстовых баз данных – в базе собраны исследования аналитических центров, научные и статистические данные способствующие изучению и пониманию современного Китая.
⚫️CNKI. Коллекция полнотекстовых баз данных – включает в себя публикации китайских и зарубежных академических периодических изданий, докторские и магистерские диссертаций, а также издания университетов и научно-исследовательских институтов.
Электронные ресурсы в области химии, машиностроения и инженерных наук (приём заявок – до 20 сентября 2024 года):
⚫️Questel. Ресурс Orbit Chemistry module – модуль, интегрированный в платформу Orbit Intelligence, предназначенный для поиска молекул в более чем 75 миллионах патентных документах.
⚫️SAGE Publications. Полнотекстовая коллекция журналов IMechE Journal Collection – коллекция журналов, охватывающая широкий спектр областей машиностроения и инженерных наук.
Image by tippapatt from Adobe Stock