Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML.
Из плюсов такого подхода стоит отметить вот что:
🔸 готовый, повсеместно используемый и поддерживаемый формат
🔸 простой и понятный файл, удобочитаемый для человека
🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек
Но есть и минусы
🔹 затраты времени при записи файла (кодирование данных в нужный формат строки)
🔹 затраты времени при чтении файла (декодирование данных в Python объекты)
🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...)
🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда)
🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные
Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи.
Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳.
🔸 очень быстрая запись
🔸 чтение значительно быстрей чем JSON, YAML итд
🔸 размер файла значительно меньше, так как нет разметки
🔸 можно записывать данные по мере поступления не загружая всё в память
🔸 можно извлечь любую часть данных независимо
Из минусов
🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата)
🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию.
🔹 не так-то просто создать такой файл без специальной библиотеки
В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии.
(Это не означает что нельзя записать данные разного типа, просто это будет не так удобно)
Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого
f15d cd29 a564 4578 ...
09e2 9bc4 a696 1253 ...
84e9 4de1 3b23 c24a ...
2534 5161 28e0 709d ...
...
Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла.
К чему это я? Читайте в следующем посте...
#tricks#basic
Mistral 3: мультимодальный, открытый, но... уже догоняющий
Французская Mistral AI выпустила семейство моделей Mistral 3. Главное:
✅ Mistral Large 3 (41B) — мультимодальная (текст+изображение), открытая (Apache 2.0). Похожа архитектурно на DeepSeek V3.
✅Ministral (14B, 8B, 3B) — тоже мультимодальные, компактные.
Но грустная правда: это не прорыв. Модель на бенчах лишь сравнивается с DeepSeek-V3.1 и Kimi K2, которые уже стали стандартом. Пока европейцы готовили релиз, в Китае вышла уже следующая итерация.
Архитектурное «вдохновение» у китайских коллег и скромные результаты делают релиз скорее шагом в догоняющих. В опенсорс-гонке ИИ Китай пока уверенно рулит, задавая темп и планку.
Европейский ИИ стабилен: круассаны есть, прорывов нет.
#MistralAI#ИИ#Opensource#LLM
https://t.me/semasci
🇫🇷Mistral Publishes First Full Lifecycle Emissions Report for AI Model
French AI company Mistral has released what it describes as the first "comprehensive lifecycle analysis" of an AI model, titled “Our contribution to a global environmental standard for AI.” The report covers the environmental impact of model development end-to-end, marking a step toward establishing global benchmarks for carbon transparency in AI.
As the energy demands of training and deploying large models draw increasing scrutiny, Mistral’s move sets a precedent: environmental accountability is no longer optional in frontier AI development. Without lifecycle visibility, sustainable innovation remains an empty claim.
#AI#Sustainability#MistralAI#AIEthics
⚡️Mistral выпустила Small 4.
Mistral Small 4 - это мультимодальный комбайн, который закрывает сразу три задачи: ризонинг, агентный кодинг и работу с изображениями. Раньше под каждую из них была отдельная модель: Magistral, Devstral и Pixtral. Теперь один чекпоинт,
🟡Архитектура
MoE с 128 экспертами, из которых на каждый токен активируются 4. Всего 119B параметров, активных - 6B на токен. Контекстное окно - 256 тыс. токенов.
По сравнению с Mistral Small 3 в новой версии задержка сократилась на 40%, пропускная способность выросла в 3 раза.
Ключевая фича - параметр reasoning_effort. Если поставить none будет быстрый чат-режим, как в Small 3.2, а с ключом high модель начнет разворачивать цепочку рассуждений, сопоставимую с Magistral. Переключение в рантайме, без смены модели.
🟡Тесты
Small 4 с включенным reasoning обходит GPT-OSS 120B на LiveCodeBench и генерирует при этом на 20% меньше токенов.
На AA LCR набирает 0.72 при длине ответа 1.6K символов. Для сравнения, модели Qwen для тех же результатов нужно от 5.8K до 6.1K.
Для self-hosted деплоя минимальный стенд - 4× NVIDIA HGX H100, 2× HGX H200 или 1× DGX B200.
Попробовать бесплатно можно на build.nvidia.com, через Mistral API или AI Studio.
📌 Лицензирование: Apache 2.0 License.
🟡Статья
🟡Набор моделей
@ai_machinelearning_big_data
#AI#ML#LLM#MistralSmall4#MistralAI
🚀 Mistral представили обновления для Le Chat:
- Более 20 коннекторов на базе MCP — от Databricks и Snowflake до GitHub и Asana.
- Новая функция Memories — ассистент запоминает важные взаимодействия, а пользователь может полностью управлять памятью (добавлять, редактировать, удалять).
Обновления делают Le Chat одним из самых удобных и готовых к бизнес-задачам AI-ассистентов.
Попробовать можно на сайте chat.mistral.ai или в мобильном приложении.
🟠 Подробности: https://mistral.ai/news/le-chat-mcp-connectors-memories.
@ai_machinelearning_big_data
#MistralAI#LeChat#AIassistant#MCP
Circle Acquires Hashnote; $5.6M for Wingbits
🔍 Institutional investment management platform Hashnote acquired by Circle.
💰 Wingbits, a token-incentivized flight tracking network, raises $5.6M in a strategic funding round led by Borderless Capital and Bullish, with participation from various investors.
🔄 Significant crypto movement detected: 2,410 #BTC (worth $253M) transferred to Coinbase Institutional.
⚡ Mantle announces a financial blockchain center with a treasury of $4.3B, planning expansion of mETH and FBTC Protocols in 2025.
🌐 Mistral AI aims for IPO and opens Singapore office as part of regional expansion.
🏛️ Major U.S. Bitcoin miner MARA advocates for Bitcoin reserves in 50 states with state-level bills under consideration.
🚀 Stargate Project initiated by tech giants for AI infrastructure in the U.S., with $500 billion investment planned by 2029.
🔗Read more about Mantle's blockchain center.
#Hashnote#Circle#Wingbits#Crypto#BTC#Mantle#mETH#FBTC#MistralAI#IPO#MARA#Bitcoin#StargateProject#AI#VC