Можно ли в Python создавать бинарные файлы? Конечно можно.
Для этого в Python есть следующие инструменты:
▫️ тип данных bytes и bytearray
▫️ открытие файла в режиме wb (write binary) или rb (read binary)
▫️ модуль struct
Про модуль struct поговорим в первую очередь.
Файл в формате JSON или Yaml внутри себя содержит разметку данных. Всегда можно определить где список начался а где закончился. Где записана строка а где словарь. То есть формат записи данных содержит в себе элементы разметки данных.
В binary-файле данные не имеют визуальной разметки. Это просто байты, записанные один за другим. Правила записи и чтения находятся вне файла.
Модуль struct как раз и помогает с организацией данных в таком файле с помощью определения форматов записи для разных частей файла.
Модуль struct преобразует Python-объекты в массив байт, готовый к записи в файл и имеющий определённый вид.
Для этого всегда следует указывать формат преобразования (или, как оно здесь называется - запаковки).
Формат нужен для того, чтобы выделить достаточное количество байт для записи конкретного типа объекта. В последствии с помощью того же формата будет производиться чтение.
При этом следует помнить что мы говорим о типах языка С а не Python.
Именно формат определяет, что записано в конкретном месте файла, число, строка или что-то еще.
Вот какие токены формата у нас есть.
Помимо этого, первым символом можно указать порядок байтов. На разных системах одни и те же типы данных могут записываться по-разному, поэтому желательно указать конкретный способ из доступных. Если этого не сделать, то используется символ '@', то есть нативный для текущей системы.
В строке формата мы пишем в каком порядке и какие типы собираемся преобразовать в байты.
Запакуем в байты простое число, токен "i".
>>> import struct
>>> struct.pack('=i', 10)
b'\n\x00\x00\x00'
Теперь несколько float, при этом нужно передавать элементы не массивом а последовательностью аргументов.
>>> struct.pack('=fff', 1.0, 2.5, 4.1)
b'\x00\x00\x80?\x00\x00 @33\x83@'
Вместо нескольких токенов можно просто указать нужное количество элементов перед одним токеном, результат будет тот же.
>>> struct.pack('=3f', 1.0, 2.5, 4.1)
b'\x00\x00\x80?\x00\x00 @33\x83@'
Теперь запакуем разные типы
>>> data = struct.pack('=fiQ', 1.0, 4, 100500)
я запаковал типы float, int и unsigned long long (очень большой int, на 8 байт)
b'\x00\x00\x80?\x04\x00\x00...'
Распаковка происходит аналогично, но нужно указать тот же формат, который использовался при запаковке. Результат возвращается всегда в виде кортежа.
>>> struct.unpack('=fiQ', data)
(1.0, 4, 100500)
Как видите, ничего страшного!
#lib#basic
🔒 NebulaEncrypt - Chrome Extension for Secure Local Encryption on the Web.
• Автор этого репозитория решил еще больше обезопасить свои сообщения в Telegram и закодил плагин для локального шифрования для Telegram Web.
• Идея такая, отправлять не явные сообщения, а локально зашифрованные и далее плагин на лету их расшифровывает непосредственно на клиенте. Тем самым, даже если сервер скомпрометируют, то там можно будет найти только ваши закодированные сообщения, которые зашифрованы локальным ключем.
• Плагин больше, как концепция, интересно было попробовать насколько это может быть удобно. Так то можно использовать не только в телеге, но и в других мессенджерах, главное написать адаптер.
➡https://github.com/dmitrymalakhov/NebulaEncrypt
#Privacy
#PRIVACY
Il Garante per la protezione dei dati personali ha ordinato all’INPS il pagamento di una sanzione pari a 300mila euro in relazione alle violazioni commesse nell’ambito dell’accertamento effettuato dall’istituto di previdenza per il “bonus Covid” ai politici muniti di partita Iva.
La motivazione: l’istituto ha effettuato incroci tra i dati dei parlamentari che hanno richiesto il bonus con quelli di altri soggetti che ricoprivano incarichi di natura politica, senza però aver prima determinato se a costoro spettasse o meno il bonus. Inoltre, l’INPS ha violato il principio di “minimizzazione dei dati”, per aver avviato i controlli volti al recupero dei bonus anche nei confronti di coloro che avevano richiesto il beneficio, senza averlo però percepito a causa dell’assenza dei requisiti previsti in tal senso.
👉@giurisprudentia
📖Scraping vs. Privacy
Daniel Solove and Woodrow Hartzog published the final version of their paper “The Great Scrape: The Clash Between Scraping and Privacy,” which offers important insights on the intersection of privacy and AI.
The paper explores the fundamental tension between scraping and privacy law. With the zealous pursuit and astronomical growth of AI, we are in the midst of what we call the “great scrape.” There must now be a great reconciliation".
#AI#Privacy
Australia's Privacy Chief Hits Brakes on Untamed AI Rollout
Australia's newly appointed Privacy Commissioner, Carly Kind, is urging caution regarding the rapid implementation of Artificial Intelligence technologies. While not opposed to AI, Kind emphasizes the need for robust safeguards before widespread adoption.
Kind expresses frustration with the tech industry's push for swift AI deployment, prioritizing speed over careful consideration of potential risks and ethical implications. She highlights the need for a measured approach, allowing time to understand the technology's nuances and establish appropriate regulations to prevent misuse.
Australia's cautious approach to AI deployment reflects growing global concerns about the responsible development and use of this powerful technology. As AI continues to evolve, ensuring its implementation aligns with ethical principles and safeguards privacy will be crucial.
#ResponsibleAI#Privacy
19 октября успешно прошел Евразийский конгресс по защите данных (EDPC 2023).
DPO крупных компаний рассказывали об опыте построения систем защиты персональных данных.
Тема актуальная, доклады чрезвычайно полезные.
#privacy#dataprotection