Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML.
Из плюсов такого подхода стоит отметить вот что:
🔸 готовый, повсеместно используемый и поддерживаемый формат
🔸 простой и понятный файл, удобочитаемый для человека
🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек
Но есть и минусы
🔹 затраты времени при записи файла (кодирование данных в нужный формат строки)
🔹 затраты времени при чтении файла (декодирование данных в Python объекты)
🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...)
🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда)
🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные
Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи.
Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳.
🔸 очень быстрая запись
🔸 чтение значительно быстрей чем JSON, YAML итд
🔸 размер файла значительно меньше, так как нет разметки
🔸 можно записывать данные по мере поступления не загружая всё в память
🔸 можно извлечь любую часть данных независимо
Из минусов
🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата)
🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию.
🔹 не так-то просто создать такой файл без специальной библиотеки
В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии.
(Это не означает что нельзя записать данные разного типа, просто это будет не так удобно)
Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого
f15d cd29 a564 4578 ...
09e2 9bc4 a696 1253 ...
84e9 4de1 3b23 c24a ...
2534 5161 28e0 709d ...
...
Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла.
К чему это я? Читайте в следующем посте...
#tricks#basic
Anthropic запустили программу AI for Science [1] обещая выдавать существенное количество кредитов для запросов к их AI моделям. Акцент в их программе на проекты в областях биологии и наук о жизни, обещают выдавать кредитов до 20 тысяч USD, так что это вполне себе серьёзные гранты для небольших целевых проектов. Ограничения по странам не указаны, но указание научного учреждения и ещё многих других данных в заявке обязательно.
И на близкую тему Charting the AI for Good Landscape – A New Look [2] о инициативах в области ИИ затрагивающих НКО и инициативы по улучшению жизни, так называемые AI for Good. Применение AI в науках о жизни - это почти всегда AI for Good, так что всё это очень взаимосвязано.
Ссылки:
[1] https://www.anthropic.com/news/ai-for-science-program
[2] https://data.org/news/charting-the-ai-for-good-landscape-a-new-look/
#openaccess#openscience#ai#grants#readings
☀️ Surya: фундаментальные модели ИИ для гелиофизики и предсказания воздействии солнца на космическое и земное пространство.
NASA и IBM выпустили в опенсорс Surya Heliophysics Foundational Model — крупномасштабную ИИ-модель, обученную на данных за 9 лет наблюдений за космосом спутника Solar Dynamics Observatory (SDO).
🟢 Зачем это нужно:
Солнечные бури влияют на нашу жизнь:
🛰️ могут вывести из строя спутники
✈️ нарушить работу навигации в самолётах
⚡ вызвать перебои с электричеством
👨🚀 создать радиационную угрозу для астронавтов
Иногда вспышки сопровождаются потоками частиц, которые повреждают электронику и опасны для здоровья.
🟠 Чем интересна Surya:
- Обучена на 9 годах наблюдений за Солнцем
- Позволяет предсказать вспышки на солнце за 2 часа до их
- Показывает точное место на Солнце, где произойдёт вспышка
- Помогает заранее подготовиться авиации, энергетике и связи к возможным проблемам.
🚀 IBM и NASA десятилетиями работали над моделями климата и погоды на Земле. Теперь они перешли к прогнозированию «космической погоды».
▪HF: https://huggingface.co/nasa-ibm-ai4science
▪Модели: https://huggingface.co/nasa-ibm-ai4science/models
▪Датасеты: https://huggingface.co/nasa-ibm-ai4science/datasets
@ai_machinelearning_big_data
#AI4Science#Heliophysics#OpenScience#MachineLearning#NASA#IBM
🚨Call for Entries: Einstein Foundation Award 2026🌍🔬
Researchers, institutions, and early-career innovators worldwide are invited to apply for the Einstein Foundation Award for Promoting Quality in Research.
🏆 Recognizing excellence in:
• Transparency
• Integrity
• Reproducibility
• Responsible research practices
💶 Prize fund: €350,000 across three categories.
📅Deadline: 30 April 2026 (10 PM UTC)
If your work is improving the quality of science, this is your chance to gain global recognition.
🔗 Apply now: https://award.einsteinfoundation.de
You need more opportunities to be released? If so, ለምታዉቁአቸው ሰዎች ቶሎ ቶሎ share አድርጉ!
👇👇
👇👇👇👇👇👇👇
@vet_opportunities
@vet_opportunities
@vet_opportunities
👆👆👆👆👆👆👆
#Research#Scholarship#Science#Funding#Academia#Innovation#OpenScience
ИИ в медицине: ProteusAI – не чат-боты, а реальные клетки для лечения
Мы привыкли обсуждать новые версии чат ботов и сравнивать их между собой... Здорово, но уже обыденность...
Настоящий прорыв — когда ИИ создает новые методы лечения на клеточном уровне. Пример — платформа ProteusAI (PROTein Evolution Using Selection, Сиднейский университет).
Суть разработки (Что делает ИИ?):
ProteusAI — "биологический ИИ" для ускоренной эволюции белков прямо в клетках млекопитающих. Его сила:
1. Умный поиск вместо перебора: ИИ исследует миллионы возможных генетических последовательностей (включая несуществующие в природе), фокусируясь на перспективных вариантах под конкретную задачу.
2. Работа в "человеческих" клетках: Эволюция происходит *внутри клеток млекопитающих*, поэтому полученные белки стабильны и функциональны в среде, релевантной для человека.
3. Решение сложных задач: ИИ находит неочевидные решения для "трудных" мишеней (специфичные участки ДНК, сложные белки).
Почему это важно для пациентов?
ProteusAI создает основу для:
➡️Более эффективных генных терапий и таргетных лекарств (особенно против рака).
➡️Усовершенствованных инструментов редактирования генома (CRISPR).
➡️Точных диагностических систем.
Ключевая ценность именно Proteus относительно конкурентов (Почему это доступно?):
➡️Бесплатна и Open Source: Любая лаборатория или стартап может использовать и модифицировать платформу.
➡️Минимальные требования: Достаточно стандартной лаборатории и компьютера (не нужны дорогие роботы).
➡️Релевантность: Белки создаются *непосредственно в клетках млекопитающих* — готовы к медицинскому применению.
Значение для медицины:
➡️Ускоряет разработку методов лечения (годы → недели).
➡️Дает шанс малым командам создавать прорывные терапии.
➡️Решает задачи, недоступные традиционным методам.
Заключение:
ProteusAI — ИИ, который создает "живые инструменты" для лечения внутри клеток. Его открытость — ключ к быстрому появлению новых, эффективных методов лечения для пациентов по всему миру.
Ссылки:
➡️Scientists create biological 'artificial intelligence' system
➡️A chimeric viral platform for directed evolution in mammalian cells
#ИИВмедицине#ГеннаяТерапия#ЛечениеРака#ИнженерияБелков#OpenScience#ProteusAI#БудущееМедицины
https://t.me/semasci
DeSci Gains Momentum Amid Innovation
Decentralized science (DeSci) is gaining traction with recent developments:
1️⃣Bio Protocol joins Binance Launchpool as the 69th project, focusing on decentralized science token launches. So far, 7 projects have raised $23M, with $7M allocated for research. More info here.
2️⃣Pump.science launches, allowing community-driven scientific experiments, starting with a longevity project. Their collaboration with Pulse will use health data metrics for future experiments. Learn more about Pump.science.
3️⃣ The Sci-Hub token has been introduced on pump.fun, providing access to scientific papers; the founder promotes purchasing the token to support open science. Token details here and Sci-Hub info here.
While still niche compared to AI and meme coins, DeSci is attracting interest, paving the way for wider community involvement. Let's observe how DeSci progresses into 2025!
#DeSci#BioProtocol#Binance#PumpScience#SciHub#Token#Research#Innovation#Web3#Community#HealthTech#Crypto#Launch#Investment#Experimentation#Longevity#OpenScience#Funding#Technology#Blockchain#Ethereum