Можно ли в Python создавать бинарные файлы? Конечно можно.
Для этого в Python есть следующие инструменты:
▫️ тип данных bytes и bytearray
▫️ открытие файла в режиме wb (write binary) или rb (read binary)
▫️ модуль struct
Про модуль struct поговорим в первую очередь.
Файл в формате JSON или Yaml внутри себя содержит разметку данных. Всегда можно определить где список начался а где закончился. Где записана строка а где словарь. То есть формат записи данных содержит в себе элементы разметки данных.
В binary-файле данные не имеют визуальной разметки. Это просто байты, записанные один за другим. Правила записи и чтения находятся вне файла.
Модуль struct как раз и помогает с организацией данных в таком файле с помощью определения форматов записи для разных частей файла.
Модуль struct преобразует Python-объекты в массив байт, готовый к записи в файл и имеющий определённый вид.
Для этого всегда следует указывать формат преобразования (или, как оно здесь называется - запаковки).
Формат нужен для того, чтобы выделить достаточное количество байт для записи конкретного типа объекта. В последствии с помощью того же формата будет производиться чтение.
При этом следует помнить что мы говорим о типах языка С а не Python.
Именно формат определяет, что записано в конкретном месте файла, число, строка или что-то еще.
Вот какие токены формата у нас есть.
Помимо этого, первым символом можно указать порядок байтов. На разных системах одни и те же типы данных могут записываться по-разному, поэтому желательно указать конкретный способ из доступных. Если этого не сделать, то используется символ '@', то есть нативный для текущей системы.
В строке формата мы пишем в каком порядке и какие типы собираемся преобразовать в байты.
Запакуем в байты простое число, токен "i".
>>> import struct
>>> struct.pack('=i', 10)
b'\n\x00\x00\x00'
Теперь несколько float, при этом нужно передавать элементы не массивом а последовательностью аргументов.
>>> struct.pack('=fff', 1.0, 2.5, 4.1)
b'\x00\x00\x80?\x00\x00 @33\x83@'
Вместо нескольких токенов можно просто указать нужное количество элементов перед одним токеном, результат будет тот же.
>>> struct.pack('=3f', 1.0, 2.5, 4.1)
b'\x00\x00\x80?\x00\x00 @33\x83@'
Теперь запакуем разные типы
>>> data = struct.pack('=fiQ', 1.0, 4, 100500)
я запаковал типы float, int и unsigned long long (очень большой int, на 8 байт)
b'\x00\x00\x80?\x04\x00\x00...'
Распаковка происходит аналогично, но нужно указать тот же формат, который использовался при запаковке. Результат возвращается всегда в виде кортежа.
>>> struct.unpack('=fiQ', data)
(1.0, 4, 100500)
Как видите, ничего страшного!
#lib#basic
💥DAS SOLLTE JEDER SEHEN UND HÖREN💥
Der frühere Direktor der US-Zentren für Seuchenschutz und -prävention (#CDC), Dr. Robert Redfield sagt:
Die COVID-Impfung hätte nicht als Impfstoff bezeichnet werden dürfen sondern als Medikament, da es die die Infektion nicht stoppt!
🦅#TEAMHEIMAT🇩🇪
The Atlantic: федеральные данные США и данные штатов по COVID-19 не совпадают
Коронавирус стал серьёзным испытанием не только для простых граждан, но и отличным тестом эффективности государственных механизмов. В результате мы видим, что даже самые эффективные государства в мире серьёзно "сбоят" перед вызовами подобного масштаба. Например, в США со статистикой вокруг текстов на Covid-19 творится настоящий бардак: штаты дают одни цифры, федеральное правительство - другие, и местами они отличаются друг от друга на десятки процентов. А ведь количество тестов необходимо для того, чтобы понять масштаб заражения, уровень смертности, и, соответственно необходимые действия в том или ином направлении. В результате журналистам, учёным и даже некоторым политикам приходится полагаться на негосударственный проект, возможности которого очевидно ниже, чем у федерального правительства.
«Анализ данных CDC на уровне штатов обнаруживает серьезные расхождения между тем, что сообщают многие штаты, и данными федерального правительства. Например, во Флориде эта разница огромна. В пятницу правительство штата сообщило, что с начала вспышки по всему штату было проведено около 700 000 тестов на коронавирус... Тем не менее, по данным CDC за этот же период проведено более чем 919 000 тестов. Это на 31% больше, чем, по мнению представителей самой Флориды. «Если происходит подобное, то представители CDC должны взять трубку и позвонить во Флориду с простым вопросом: «Что происходит?» - считает Ашиш Джа, профессор здравоохранения в Гарварде.
Учитывая сложность и огромное количество источников данных, некоторые неточности, безусловно, объяснимы. Но обнаруженные нами несоответствия свидетельствуют о том, что Флорида не является исключением. В 22 штатах количество тестов CDC отличается от числа, сообщенного правительством штата, более чем на 10 процентов. В 13 штатах расхождение более чем 25 процентов. В некоторых случаях количество тестов, указанных CDC намного выше, чем сообщают штаты; в других гораздо ниже».
https://theidealist.ru/cdcdata/
#TheAtlantic#власть#общество#США#статистика#CDC#коронавирус
🏥 Trump Picks a Mainstream Face for the CDC
Donald Trump has formally named Erica Schwartz to lead the CDC. The choice signals a turn away from vaccine politics and toward someone who can look credible to the public after months of turmoil inside the agency.
Schwartz is not coming in to sell a new ideology. She is coming in to clean up a mess. The CDC has been battered by political fights, legal challenges, staff losses, and Kennedy’s unpopular vaccine agenda, and the agency now needs basic authority more than another round of messaging theater.
That is a political reversal, even if the White House will not say it that way. The administration is trying to blunt the damage before the midterms, calm the public-health establishment, and stop the CDC from looking like a culture war machine with a lab coat on.
Schwartz will still have a hard job. She would be taking over an agency where trust has eroded, staff morale is badly damaged, and vaccine policy has become a battlefield instead of a public health tool. The real test is whether she can restore some discipline before the next crisis arrives.
#cdc#trump#health#vaccines#kennedy#publichealth
📱American Оbserver - Stay up to date on all important events
🇺🇸
#java#cdc#chunjun#dataops#datax#etl#flink#flink_streaming#java
TIS is an easy enterprise data integration tool using batch (DataX) and streaming (Flink-CDC, Chunjun) with a simple interface to sync data end-to-end without complex scripts. Its v5.0.0 adds Pipeline AI Agent, letting you describe needs in natural language for auto-pipeline creation, smart plugin installs, and low-cost AI like DeepSeek. Install quickly via single-node, Docker, or K8S. This saves you time, cuts errors, simplifies ETL tasks, and boosts fun, efficient data pipelines for real-time analytics.
https://github.com/datavane/tis