Можно ли в Python создавать бинарные файлы? Конечно можно.
Для этого в Python есть следующие инструменты:
▫️ тип данных bytes и bytearray
▫️ открытие файла в режиме wb (write binary) или rb (read binary)
▫️ модуль struct
Про модуль struct поговорим в первую очередь.
Файл в формате JSON или Yaml внутри себя содержит разметку данных. Всегда можно определить где список начался а где закончился. Где записана строка а где словарь. То есть формат записи данных содержит в себе элементы разметки данных.
В binary-файле данные не имеют визуальной разметки. Это просто байты, записанные один за другим. Правила записи и чтения находятся вне файла.
Модуль struct как раз и помогает с организацией данных в таком файле с помощью определения форматов записи для разных частей файла.
Модуль struct преобразует Python-объекты в массив байт, готовый к записи в файл и имеющий определённый вид.
Для этого всегда следует указывать формат преобразования (или, как оно здесь называется - запаковки).
Формат нужен для того, чтобы выделить достаточное количество байт для записи конкретного типа объекта. В последствии с помощью того же формата будет производиться чтение.
При этом следует помнить что мы говорим о типах языка С а не Python.
Именно формат определяет, что записано в конкретном месте файла, число, строка или что-то еще.
Вот какие токены формата у нас есть.
Помимо этого, первым символом можно указать порядок байтов. На разных системах одни и те же типы данных могут записываться по-разному, поэтому желательно указать конкретный способ из доступных. Если этого не сделать, то используется символ '@', то есть нативный для текущей системы.
В строке формата мы пишем в каком порядке и какие типы собираемся преобразовать в байты.
Запакуем в байты простое число, токен "i".
>>> import struct
>>> struct.pack('=i', 10)
b'\n\x00\x00\x00'
Теперь несколько float, при этом нужно передавать элементы не массивом а последовательностью аргументов.
>>> struct.pack('=fff', 1.0, 2.5, 4.1)
b'\x00\x00\x80?\x00\x00 @33\x83@'
Вместо нескольких токенов можно просто указать нужное количество элементов перед одним токеном, результат будет тот же.
>>> struct.pack('=3f', 1.0, 2.5, 4.1)
b'\x00\x00\x80?\x00\x00 @33\x83@'
Теперь запакуем разные типы
>>> data = struct.pack('=fiQ', 1.0, 4, 100500)
я запаковал типы float, int и unsigned long long (очень большой int, на 8 байт)
b'\x00\x00\x80?\x04\x00\x00...'
Распаковка происходит аналогично, но нужно указать тот же формат, который использовался при запаковке. Результат возвращается всегда в виде кортежа.
>>> struct.unpack('=fiQ', data)
(1.0, 4, 100500)
Как видите, ничего страшного!
#lib#basic
🦙 Meta lanza el modelo de lenguaje de código abierto más grande: Llama 3.1-405B
Meta ha sorprendido al mundo de la inteligencia artificial al presentar su nuevo y más potente modelo de lenguaje de código abierto:Llama 3.1-405B.
Hechos clave
⭐️ Parámetros: Llama 3.1-405B es el modelo más grande de la serie Llama, con 405 mil millones de parámetros. Esta última versión también incluye versiones mejoradas de modelos con 8 mil millones y 70 mil millones de parámetros.
El número de parámetros afecta la capacidad del modelo para razonar, entender el contexto y generar contenido diverso, preciso y creativo. Más parámetros requieren recursos informáticos más significativos.
📊Comparativas: El modelo insignia es competitivo con los principales modelos fundacionales en diversas tareas, incluyendo GPT-4o y Claude 3.5 Sonnet. Consulta la comparación en comprensión del lenguaje (MMLU), codificación (HumanEval) y matemáticas (GSM8K y MATH) 🔼
🖼 Multimodalidad: Llama 3.1 puede reconocer y generar tanto texto como imágenes. El modelo ya se ha integrado en la versión beta de WhatsApp para Android.
🔒Código abierto: Llama 3.1 permite a desarrolladores e investigadores utilizarlo en sus proyectos. Esto lo hace accesible para más usuarios, incluidas universidades y pequeñas empresas.
🖥 Ventana de contexto: El modelo utiliza un nuevo tokenizador que expande el vocabulario de 32K a 128K tokens, mejorando el procesamiento del lenguaje y permitiendo trabajar de manera más eficiente con el texto al recordar más contexto.
➡️ Prueba Llama 3.1-405B aquí.
📱 Mark Zuckerberg ya ha dado una entrevista en video.
En la serie anterior:
❓Código abierto vs. código cerrado
🦙Llama 3 ha sido lanzado. Es el mayor LLM de código abierto.
#noticias#llama@hiaimediaes
✴️Meta ускоряет план: Llama 4.X до конца года, Llama 5 — в 2026
Meta, судя по заявлениям Марка Цукерберга, готовит заметное обновление линейки после неоднозначного старта Llama 4. Компания ускоряет цикл релизов и одновременно чинит слабые места текущего поколения, чтобы вернуть доверие разработчиков и исследователей.
Что ожидается в ближайшее время:
🟡Llama 4.X выйдет до конца года и станет первым релизом нового подразделения Meta Superintelligence Labs (MSL).
🟡Llama 5 — следующая ступень линейки — запланирована на 2026 год.
🟡 Параллельно Meta раскатывает патчи для Llama 4 (версии 4.1 и 4.2) с упором на исправление замечаний по производительности и качеству ответов.
🤑ForgetMe | Boosty
Приобрести подписку на любые сервисы
⏩@forgetshop_bot
#нейросети#новости#llama
🪄Добавили в GPTunneL сразу две новые нейросети LlaMA 4
Теперь в нашем сервисе доступны передовые модели от Meta с архитектурой Mixture of Experts (MoE)*.
⚫️LlaMA 4 Maverick (400B):
Флагманская модель с контекстом в 1 миллион токенов, заточена под сложные задачи: математика, программирование, гуманитарные науки. Включает 128 экспертов (с 17B активными параметрами).
⚫️LlaMA 4 Scout (107B):
Компактная и быстрая модель с контекстным окном в 10 миллионов токенов, легко справляется с анализом длинных текстов. Использует 16 экспертов (из которых одновременно активны 17B параметров).
*Mixture of Experts (MoE) - это архитектура нейронной сети, где несколько «экспертных» моделейспециализируются на разных аспектах задачи, а специальная сеть-маршрутизатор определяет, какого эксперта использовать для конкретной задачи. Подробнее —в нашем гайде по промпт инжинирингу.
🦛Meta также анонсировала модель Llama 4 Behemoth с 288 миллиардами активных параметров и общей архитектурой на 2 триллиона параметров. Однако эта модель всё ещё находится в стадии обучения и пока недоступна для использования.
🔗Протестировать LlaMA 4 Maverick и Scout в GPTunneL
#update@gptunnel#llama@gptunnel
Meta 扩大员工使用竞争对手 AI 工具权限,含 ChatGPT-5、 Gemini 3 Pro 等
Meta正在积极推动“人工智能优先”的办公环境,扩大员工使用包括谷歌Gemini 3 Pro和OpenAI ChatGPT-5在内的外部人工智能工具的权限。公司内部文件显示,Meta鼓励员工将人工智能融入所有工作流程,并计划将自主研发的Llama系列模型与其他企业产品结合使用。Meta已在人工智能技术上投入巨资,并推出了Metamate等内部人工智能助手。此外,Meta还与Midjourney合作,将图像生成技术整合到自身产品中,并将内部办公套件迁移至谷歌Workspace。公司通过内部激励机制和绩效考核,鼓励员工积极应用人工智能技术,以提升工作效率和研发进度。IT之家
🏷#Meta#人工智能#Llama
📢频道👥群组📝投稿
¿Que puede hacer este bot?
🤖@mysticella_bot
📎Crea y chatea con modelos de IA en Telegram con soporte para GPT, Gemini, LLama y más. Uso gratuito.
#chatgpt#ai#llama
( Visto en: @BotsGram_Cu )
The Atlantic: на чьих книгах учатся ИИ-алгоритмы?
Ни для кого не секрет, что эффективность алгоритмов генеративного ИИ строится прежде всего на огромных базах данных текстовой информации. Но что составляет их основу? Чьими словами говорят с нами ChatGPT, Llama и другие языковые модели? Алекс Рейснер из The Atlantic пытается разобраться.
«Часть обучающих текстов берется из Википедии и других сетевых источников, но для качественного генеративного ИИ требуется более качественный материал, чем тот, который обычно можно найти в Интернете, то есть тот, который можно найти в книгах. В иске, поданном в Калифорнии в прошлом месяце, писатели Сара Сильверман, Ричард Кадри и Кристофер Голден утверждают, что Meta нарушила закон об авторском праве, использовав их книги для обучения LLaMA, большой языковой модели, аналогичной GPT-4 от OpenAI, — алгоритма, который может генерировать текст, подражая шаблонам слов, найденным в образцах текстов. Однако ни сам иск, ни комментарии вокруг него не дают возможности заглянуть под капот: мы не знаем точно, обучалась ли LLaMA на книгах Сильвермана, Кадри, Голдена или других авторов».
https://theidealist.ru/llama/
#TheAtlantic#технологии#ИИ#Llama#книги