TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #239 · 3 мај

Один из самых удобных способов записать данные это использование готовых форматов, такие как JSON или YAML. Из плюсов такого подхода стоит отметить вот что: 🔸 готовый, повсеместно используемый и поддерживаемый формат 🔸 простой и понятный файл, удобочитаемый для человека 🔸 можно легко редактировать в любом текстовом редакторе без специальных программ и библиотек Но есть и минусы 🔹 затраты времени при записи файла (кодирование данных в нужный формат строки) 🔹 затраты времени при чтении файла (декодирование данных в Python объекты) 🔹 размер файла увеличивается из-за разметки данных (скобки, запятые, переносы, отступы...) 🔹 перед записью все данные должны быть помещены в память в полном объёме (не всегда) 🔹 при чтении необходимо считать весь файл в память и только потом декодировать данные Если нужно писать немного данных в несколько файлов, то затраты по времени не ощутимы. Обычно это файлы конфига или какие-либо метаданные. Это отличный вариант под такие задачи. Есть и другой поход к записи файлов - это бинарные файлы. Используется, когда данных достаточно много и никто их не собирается читать глазками😳. 🔸 очень быстрая запись 🔸 чтение значительно быстрей чем JSON, YAML итд 🔸 размер файла значительно меньше, так как нет разметки 🔸 можно записывать данные по мере поступления не загружая всё в память 🔸 можно извлечь любую часть данных независимо Из минусов 🔹 нужно определить свой формат записи данных (если не используете готовую спецификацию определённого формата) 🔹 не получится открыть файл и визуально понять что там записано, а для чтения файла потребуется знать его спецификацию. 🔹 не так-то просто создать такой файл без специальной библиотеки В таком виде удобно записывать большой массив любых однородных данных. Например, мониторинг валютной биржи или кэшированная анимация 3D геометрии. (Это не означает что нельзя записать данные разного типа, просто это будет не так удобно) Представьте себе JPG-картинку. По сути это немного мета-информации и большой массив пикселей. Тоже самое со звуком или видео файлом. Поэтому, если вы попробуете открыть картинку в текстовом редакторе вы увидите что-то вроде такого f15d cd29 a564 4578 ... 09e2 9bc4 a696 1253 ... 84e9 4de1 3b23 c24a ... 2534 5161 28e0 709d ... ... Это и есть записанные байтики. И для их чтения требуется определённый софт который знает что с ними делать. Под каждый тип файла. К чему это я? Читайте в следующем посте... #tricks#basic

Резултати

Пронајдени 8 слични објави

Пребарај: #llmops

当前筛选 #llmops清除筛选
Data Science Jobs

@datasciencejobs · Post #2244 · 02.08.2024 г., 18:03

#вакансия#Москва#senior#mlops#ml#llmops#devops#mle Мы - международная компания, лаборатория продуктов, где мы стремится стать лидерами в области VR/XR, web3, машинного обучения и нейронных сетей. Компания разрабатывает и внедряет революционные решения, устанавливая новые стандарты и вдохновляя на достижение невозможного в области информационных технологий. Наша команда - это открытый, заряженный и молодой коллектив, который приветствует инновационные идеи и поддерживает инициативу и творчество наших сотрудников. Один из приоритетных продуктов нашей компании - внутренний стартап GenAI (на ранней стадии), в который сейчас ищем Senior ML Ops. Мы запускаем целую линейку инновационных продуктов (B2B, B2C сервисы полностью на основе ИИ), которые уже влияют на эволюцию генеративного ИИ в мире. Какие задачи вас ждут: - Разработка с нуля MLOps для задач генерации аудиоконтента, генерации видеоконтента, исполнения LLM: среды разработки, тестирования, инференса и мониторинга моделей в различных режимах (Batch, Streaming) и использования ресурсов (CPU, GPU); Deploy моделей в продакшн; - Внедрение инструментов отслеживания жизненного цикла моделей и версионирования модельных артефактов (ClearML, MLFlow, DVC и т.п.); - Развитие LLMOps-практик (эффективный инференс LLM, Diffusion Models). Мы ждем, что вы: - Имеете опыт работы в качестве DevOps/MLOps/MLE -Engineer не менее 2 лет; - Имеете опыт работы с k8s, уметь разрабатывать и поддерживать сервисы в этой среде; - Имеете опыт разработки высоконагруженных сервисов; - Имеете опыт развертывания и использования MLOps инструментов (ClearML, DVC, MLflow и т.п.); - Имеете опыт выстраивания CI/CD; - Имеете опыт деплоя моделей в формате ONNX; - Знаете принципов организации распределеаюнных информационных систем и баз данных. Что мы предлагаем: - Вилка: 4k$ - 5k$ - Сильная команда, с которой можно расти; - Работа над задачами, которые до вас никто не решал; - Возможность присоединится в компанию у самых ее истоков; - Офис в Москва Сити; - Гибкое начало рабочего дня (до 10:00); - Sick days; - Медицинская страховка; - Реферальная программа. По всем вопросам обращайтесь к @IraRozhnova

Data Science Jobs

@datasciencejobs · Post #2900 · 03.09.2025 г., 10:03

#работа#удаленнаяработа#вакансия#LLMOps#ML#middle#Kubernetes#DevOps#LLM Позиция: LLMOps-инженер Полная занятость График: 5/2 Формат работы: удалённо Компания: 7RedLines Оформление: ТК РФ Оклад на руки: 200 000 – 300 000к Требования к кандидату: • Высшее образование: техническое, математическое и тд. • Опыт работы DevOps инженером от 3х лет • Опыт в DevOps, MLOps или backend • Уверенное владение Python • Опыт работы с облачными платформами (AWS, Azure, GCP) • Знание Docker, Kubernetes и CI/CD инструментов • Управление ресурсами и оптимизация затрат • Автоматизация процессов развертывания и масштабирования • Интеграция систем мониторинга и оповещения • Обеспечение безопасности и производительности LLM систем • Преимуществом будут опыт работы на ML-проекте, понимание архитектуры генеративного ИИ и работы с LLM Обязанности кандидата: • Разработка и управление LLM пайплайнами для обработки данных, развертывания моделей • Автоматизация LLM задач с использованием CI/CD и контейнерных технологий • Настройка систем мониторинга для отслеживания производительности моделей • Оптимизация инфраструктуры и конфигурация больших языковых моделей для высоких нагрузок • Анализ требований проекта и оценка необходимых аппаратных ресурсов • Мониторинг использования ресурсов и планирование масштабирования инфраструктуры Контактная информация: Тг: @HR7RedLines Эл.почта: [email protected]

GitHub Trends

@githubtrending · Post #15326 · 11.12.2025 г., 11:30

#python#agents#gcp#gemini#genai_agents#generative_ai#llmops#mlops#observability You can quickly create and deploy AI agents using the Agent Starter Pack, a Python package with ready-made templates and full infrastructure on Google Cloud. It handles everything except your agent’s logic, including deployment, monitoring, security, and CI/CD pipelines. You can start a project in just one minute, customize agents for tasks like document search or real-time chat, and extend them as needed. This saves you time and effort by providing production-ready tools and integration with Google Cloud services, letting you focus on building smart AI agents without worrying about backend setup or deployment details. https://github.com/GoogleCloudPlatform/agent-starter-pack

GitHub Trends

@githubtrending · Post #14868 · 26.06.2025 г., 12:00

#typescript#ai_gateway#gateway#generative_ai#hacktoberfest#langchain#llama_index#llmops#llms#openai#prompt_engineering#router The AI Gateway by Portkey lets you connect to over 1600 AI models quickly and securely through one simple API, making it easy to integrate any language, vision, or audio AI model in under two minutes. It ensures fast responses with less than 1ms latency, automatic retries, load balancing, and fallback options to keep your AI apps reliable and scalable. It also offers strong security with role-based access, guardrails, and compliance with standards like SOC2 and GDPR. You can save costs with smart caching and optimize usage without changing your code. This helps you build powerful, cost-effective, and secure AI applications faster and with less hassle. https://github.com/Portkey-AI/gateway

GitHub Trends

@githubtrending · Post #14661 · 02.05.2025 г., 11:30

#typescript#ai#analytics#datasets#dspy#evaluation#gpt#llm#llmops#low_code#observability#openai#prompt_engineering LangWatch helps you monitor, test, and improve AI applications by tracking performance, comparing different setups, and optimizing prompts automatically. It works with any AI tool or framework, keeps your data secure, and lets you collaborate with experts to fix issues quickly, making your AI more reliable and efficient. https://github.com/langwatch/langwatch

GitHub Trends

@githubtrending · Post #14808 · 08.06.2025 г., 13:00

#rust#ai#ai_engineering#anthropic#artificial_intelligence#deep_learning#genai#generative_ai#gpt#large_language_models#llama#llm#llmops#llms#machine_learning#ml#ml_engineering#mlops#openai#python#rust TensorZero is a free, open-source tool that helps you build and improve large language model (LLM) applications by using real-world data and feedback. It gives you one simple API to connect with all major LLM providers, collects data from your app’s use, and lets you easily test and improve prompts, models, and strategies. You can see how your LLMs perform, compare different options, and make them smarter, faster, and cheaper over time—all while keeping your data private and under your control. This means you get better results with less effort and cost, and your apps keep improving as you use them[1][2][3]. https://github.com/tensorzero/tensorzero

GitHub Trends

@githubtrending · Post #15521 · 25.02.2026 г., 11:30

#rust#ai_gateway#ai_gateway_support#envoy#envoyproxy#gateway#generative_ai#llm_gateway#llm_inference#llm_proxy#llm_routing#llmops#llms#openai#prompt#proxy#proxy_server#routing Plano is an AI-native proxy server that handles key tasks for agentic apps like routing between agents, smart LLM model selection, safety guardrails, and automatic traces for observability. Define agents in simple YAML, write basic HTTP code in any language, and start Plano to run multi-agent systems without custom plumbing or framework lock-in. You benefit by building and shipping reliable agents to production much faster, focusing on core logic while gaining safety, low latency, and easy scaling. https://github.com/katanemo/plano

GitHub Trends

@githubtrending · Post #14768 · 31.05.2025 г., 12:00

#typescript#ci#ci_cd#cicd#evaluation#evaluation_framework#llm#llm_eval#llm_evaluation#llm_evaluation_framework#llmops#pentesting#prompt_engineering#prompt_testing#prompts#rag#red_teaming#testing#vulnerability_scanners Promptfoo is a tool that helps developers test and improve AI applications using Large Language Models (LLMs). It allows you to **test prompts and models** automatically, **secure your apps** by finding vulnerabilities, and **compare different models** side-by-side. You can use it on your computer or integrate it into your development workflow. This tool helps you make sure your AI apps work well and are secure before you release them. It saves time and ensures quality by using data instead of guessing. https://github.com/promptfoo/promptfoo