Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML.
Из плюсов такого подхода стоит отметить вот что:
🔸 готовый, повсеместно используемый и поддерживаемый формат
🔸 простой и понятный файл, удобочитаемый для человека
🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек
Но есть и минусы
🔹 затраты времени при записи файла (кодирование данных в нужный формат строки)
🔹 затраты времени при чтении файла (декодирование данных в Python объекты)
🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...)
🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда)
🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные
Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи.
Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳.
🔸 очень быстрая запись
🔸 чтение значительно быстрей чем JSON, YAML итд
🔸 размер файла значительно меньше, так как нет разметки
🔸 можно записывать данные по мере поступления не загружая всё в память
🔸 можно извлечь любую часть данных независимо
Из минусов
🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата)
🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию.
🔹 не так-то просто создать такой файл без специальной библиотеки
В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии.
(Это не означает что нельзя записать данные разного типа, просто это будет не так удобно)
Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого
f15d cd29 a564 4578 ...
09e2 9bc4 a696 1253 ...
84e9 4de1 3b23 c24a ...
2534 5161 28e0 709d ...
...
Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла.
К чему это я? Читайте в следующем посте...
#tricks#basic
[미 재무부, Anthropic의 Mythos AI 취약점 점검 위해 접근 추진](https://www.bloomberg.com/news/articles/2026-04-14/us-treasury-seeking-access-to-anthropic-s-mythos-to-find-flaws)
◦ 미 재무부, 고성능 AI ‘Mythos’ 취약점 탐지 위해 접근 시도
• 재무부 기술팀이 Anthropic의 Mythos 모델 접근을 추진 → 사이버 보안 취약점 사전 탐지 목적
• CIO 샘 코르코스, 내부 사이버보안팀에 기술 브리핑 진행 및 대응 준비 지시
• 제한된 기관에만 공개된 모델 → 정부 차원의 선제적 리스크 대응 움직임
◦ Mythos, 강력한 사이버 공격 도구로 악용 가능성 제기
• Anthropic 자체 경고: 충분한 테스트 없이 공개 시 사이버 공격에 활용 가능
• 실제 테스트 결과:
- 주요 운영체제 및 웹 브라우저 전반에서 취약점 탐지 및 악용 가능
- 4개 취약점 연계한 브라우저 익스플로잇 코드 생성 사례 확인
• → AI 발전이 곧 사이버 위협 증가로 이어질 수 있음을 시사
◦ 미 정부 및 금융권, AI 기반 사이버 리스크 대응 강화
• 재무장관 베센트 + 연준 의장 파월 → 월가 주요 인사 긴급 회동
• 금융권에 Mythos 활용한 취약점 탐지 및 대비 촉구
• JPMorgan 포함 주요 은행들 내부 테스트 진행 중
◦ Anthropic, 정부와 협력 의지 밝히며 테스트 프로그램 운영
• ‘Project Glasswing’ 통해 일부 기관과 제한적 테스트 진행
• 정부와 지속적 논의 중 → 연방·주·지방 협력 가능성 강조
◦ 정부-기업 갈등: 공급망 리스크 지정 및 법적 분쟁
• 미 국방부, Anthropic을 공급망 리스크로 지정
→ 군사용 AI 활용 방식 갈등이 원인
• 6개월 내 서비스 이전 요구 → Anthropic은 연방법원에서 대응 중
• → 정부는 경계하면서도 동시에 기술 접근 시도하는 이중적 태도
◦ 핵심 인물 및 배경
• 샘 코르코스: 2025년 재무부 CIO 임명, 과거 Anthropic 기술 도입 장려
• DOGE 조직 참여 → 정부 효율화 및 기술 혁신 역할 수행
원문 발췌:
- "it was capable of identifying and then exploiting vulnerabilities in every major operating system and every major web browser when directed by a user to do so."
#Anthropic#Mythos