TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #239 · 3 мај

Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML. Из плюсов такого подхода стоит отметить вот что: 🔸 готовый, повсеместно используемый и поддерживаемый формат 🔸 простой и понятный файл, удобочитаемый для человека 🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек Но есть и минусы 🔹 затраты времени при записи файла (кодирование данных в нужный формат строки) 🔹 затраты времени при чтении файла (декодирование данных в Python объекты) 🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...) 🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда) 🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи. Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳. 🔸 очень быстрая запись 🔸 чтение значительно быстрей чем JSON, YAML итд 🔸 размер файла значительно меньше, так как нет разметки 🔸 можно записывать данные по мере поступления не загружая всё в память 🔸 можно извлечь любую часть данных независимо Из минусов 🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата) 🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию. 🔹 не так-то просто создать такой файл без специальной библиотеки В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии. (Это не означает что нельзя записать данные разного типа, просто это будет не так удобно) Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого f15d cd29 a564 4578 ... 09e2 9bc4 a696 1253 ... 84e9 4de1 3b23 c24a ... 2534 5161 28e0 709d ... ... Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла. К чему это я? Читайте в следующем посте... #tricks#basic

Резултати

Пронајдени 2 слични објави

Пребарај: #datasciense

当前筛选 #datasciense清除筛选
Data Science Jobs

@datasciencejobs · Post #2043 · 19.04.2024 г., 16:05

#вакансия#vacancy#job#timeseries #datasciense#remote Вакансия: Middle/ Senior Data Scientist Кадровое агентство: DevHunt ЗП: от 150.000 до 250.000 руб на руки Формат: удаленка Почему стоит выбрать именно эту позицию: - Удаленка с гибким началом рабочего дня - Свобода в принятии решений - Возможности для роста - Никакого тайм-трекинга - Неформальная атмосфера с минимальным числом бюрократии - Проекты не "в стол" - Плюшки IT-аккредитации - Годовые бонусы: х1, х1.5 - ДМС после испытательного срока Чек-лист идеального кандидата: - Опыт ML-разработки на Python от 3х лет - Опыт работы с Pandas, NumPy, SсiPy, scikit-learn, Keras/TensoFlow - Опыт работы с XGboost, LightGBM, Random Forest, линейными моделями, основными архитектурами нейронных сетей. Понимание механизмов их работы - Знание SQL на продвинутом уровне, опыт работы с реляционными СУБД (PostgreSQL, Oracle, MS SQL и пр.) Опыт работы с *nix системами - Навыки работы с Git и с Conda окружениями Будет плюсом: - Опыт разработки проектной документации в части подготовки разделов по предиктивному анализу - Опыт разработки архитектуры данных и структур баз данных - Знание и опыт работы с ETL/ELT инструментами Знание TimescaleDB, InfluxDB, AVEVA (OSIsoft) PI System - Понимание специфики работы IT-интегратора (outsource) - Опыт работы в нефтегазовой или смежной области Задачи: - Реализации проектов по предиктивной аналитике на промышленных предприятиях - Анализ и прогнозирование временных рядов - Анализ производственных процессов и выработка требований к сбору данных Выбор и обоснование моделей машинного обучения для решения бизнес-задач - Конструирование признаков для ML-моделей (feature engineering) Выбор и обоснование метрик для оценки моделей машинного обучения - Интерпретация результатов функционирования моделей машинного обучения - Разработка и автоматизация ML-пайплайнов Контакт:@barnes_recruiter

Data Science Jobs

@datasciencejobs · Post #1757 · 03.11.2023 г., 06:02

#вакансия#senior#python#ai#ml#ии#llm#datasciense ML-разработчик / Python-разработчик с опытом внедрения ИИ (Senior) ЗП: договорная, отталкиваемся от пожеланий кандидата Формат работы: full-time, удаленно, в офисе или гибрид Контакт:@pstarasov ❤️ О компанииЛайк: Мы EdTech компания, которая обладает уникальным доменным знанием в области бизнеса. Мы запускаем проект AI практически с нуля, поэтому в нем не будет раздражающего легаси, зато будет готовая инфраструктура и десятки разработчиков, которые могут воплотить в жизнь любые нужные тебе интерфейсы. Твоя задача – помогать в создании AI архитектуры внутри бизнеса, которая изменит рынок образования 🤔 Чем предстоит заниматься: • Создание архитектуры, на основе которой компания переедет на рельсы AI • Писать код руками. Мы ищем играющего тренера, который в будущем будет добирать команду, но основы должны быть заложены самостоятельно • У нас есть несколько направлений, которые мы успешно апробировали в формате MVP: – Продукт: верификация и генерация нового контента основываясь на базе знаний – Сервис-менеджмент: Q&A – Коммерция: технотрипваеры 👨‍💻Требования: • Опыт в Data Science от 2-х лет • Опыт работы с Python от 5-ти лет • Опыт работы с LLM и фреймворками (LangChain или аналоги) • Опыт дообучения моделей • Понимание принципов ООП, паттернов проектирования • Опыт работы с SQL, REST APIs • Будет плюсом опыт работы на уровне Deep Learning 👍 Мы предлагаем: • Возможность работать над интересными и сложными задачами в области ИИ • Удаленную работу из любой страны или работу в офисе в Москва-Сити • Конкурентоспособную зарплату • Работу в компании с IT-аккредитацией • Компенсацию 50% затрат на образовательные программы для сотрудников • Отпуск 28 календарных дней