TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #672 · 28.11

Впервые сделал крупный проект (под NDA, так что не расскажу, какой) на облачных функциях. Впечатления противоречивые. Изначально программисты арендовали компьютер в датацентре: или целиком или кусочек. На нём теоретически можно делать что угодно, но для запуска своих программ нужно было настроить операционную систему, безопасность и авторизацию, установить нужные исполнительные модули, программы для удобства деплоя, мониторинг нагрузки итд. Поэтому появились сервисы, которые это всё делают за тебя, а тебе дают буквально окно, куда можно написать свой код и запускать его удалённо на чужой машине. Конкретно я пользовался решением от Яндекса, чей протокол скопирован напрямую с Amazon Web Services. Причём, в документации не только открыто об этом говорится, но ещё и в некоторых местах перенаправляют на доки от Amazon. И SDK предлагают тоже использовать амазоновский. До санкций я бы сказал, что это не так плохо — можно использовать что-то привычное тем, кто уже работал с Amazon. Но сейчас привязка к американскому сервису выглядит скорее жирным минусом. Не знаю, есть ли у Яндекса ресурсы на какое-то серьёзное разделение. Судя по состоянию документации и платформы в целом — нет. Yandex Cloud кажется системой, которая активно развивалась несколько лет назад, а сейчас подзаброшена. Среда выполнения .NET отстаёт от актуальной на две версии (3.1 вместо 6, четвёртой версии не существует). Изначально мой проект был написан как обычное контейнеризированное приложение на .NET 6, а потом я переводил его на функции. Пришлось пройтись по всему коду и переписать несовместимые куски с C#10 на C#8, это было не слишком приятно. Документации фактически нет, а там, где есть, много путаницы. В примерах написано одно, по факту другое: например в функцию вместо объекта Request приходит просто строка, а разбирать её надо самому. Авторизацию я нашёл только на Stackoverflow. Интересно, что адекватных доков про неё не было ни у Яндекса, ни у Amazon. Функция выполняется и выгружается, поэтому ваша программа не должна рассчитывать на наличие постоянно живущего процесса. Мне пришлось вытащить из неё большой словарь, который грузится при старте, и положить уже подготовленные данные из него в Object Storage — это такое горячее файловое хранилище, там же рядом с функциями. Справедливости ради, работает это всё быстрее, чем я думал. Удалось запихнуть в функции даже сравнительно большой проект с кучей классов, создающий при запуске несколько десятков объектов и производящий загрузку из сети с декомпрессией. Другой важный плюс — бесплатная квота довольно внушительная: миллион вызовов и 10Гб*часов оперативной памяти в месяц. Для пет проекта вы сможете вообще не покупать сервер. Но если сервер у вас всё-таки есть, деплой вы уже настроили, то удобнее будет, конечно, делать как привычно. И гибкости больше. #dev

Hashtags

Резултати

Намерени 8 подобни публикации

Търсене: #llmops

当前筛选 #llmops清除筛选
Data Science Jobs

@datasciencejobs · Post #2244 · 02.08.2024 г., 18:03

#вакансия#Москва#senior#mlops#ml#llmops#devops#mle Мы - международная компания, лаборатория продуктов, где мы стремится стать лидерами в области VR/XR, web3, машинного обучения и нейронных сетей. Компания разрабатывает и внедряет революционные решения, устанавливая новые стандарты и вдохновляя на достижение невозможного в области информационных технологий. Наша команда - это открытый, заряженный и молодой коллектив, который приветствует инновационные идеи и поддерживает инициативу и творчество наших сотрудников. Один из приоритетных продуктов нашей компании - внутренний стартап GenAI (на ранней стадии), в который сейчас ищем Senior ML Ops. Мы запускаем целую линейку инновационных продуктов (B2B, B2C сервисы полностью на основе ИИ), которые уже влияют на эволюцию генеративного ИИ в мире. Какие задачи вас ждут: - Разработка с нуля MLOps для задач генерации аудиоконтента, генерации видеоконтента, исполнения LLM: среды разработки, тестирования, инференса и мониторинга моделей в различных режимах (Batch, Streaming) и использования ресурсов (CPU, GPU); Deploy моделей в продакшн; - Внедрение инструментов отслеживания жизненного цикла моделей и версионирования модельных артефактов (ClearML, MLFlow, DVC и т.п.); - Развитие LLMOps-практик (эффективный инференс LLM, Diffusion Models). Мы ждем, что вы: - Имеете опыт работы в качестве DevOps/MLOps/MLE -Engineer не менее 2 лет; - Имеете опыт работы с k8s, уметь разрабатывать и поддерживать сервисы в этой среде; - Имеете опыт разработки высоконагруженных сервисов; - Имеете опыт развертывания и использования MLOps инструментов (ClearML, DVC, MLflow и т.п.); - Имеете опыт выстраивания CI/CD; - Имеете опыт деплоя моделей в формате ONNX; - Знаете принципов организации распределеаюнных информационных систем и баз данных. Что мы предлагаем: - Вилка: 4k$ - 5k$ - Сильная команда, с которой можно расти; - Работа над задачами, которые до вас никто не решал; - Возможность присоединится в компанию у самых ее истоков; - Офис в Москва Сити; - Гибкое начало рабочего дня (до 10:00); - Sick days; - Медицинская страховка; - Реферальная программа. По всем вопросам обращайтесь к @IraRozhnova

Data Science Jobs

@datasciencejobs · Post #2900 · 03.09.2025 г., 10:03

#работа#удаленнаяработа#вакансия#LLMOps#ML#middle#Kubernetes#DevOps#LLM Позиция: LLMOps-инженер Полная занятость График: 5/2 Формат работы: удалённо Компания: 7RedLines Оформление: ТК РФ Оклад на руки: 200 000 – 300 000к Требования к кандидату: • Высшее образование: техническое, математическое и тд. • Опыт работы DevOps инженером от 3х лет • Опыт в DevOps, MLOps или backend • Уверенное владение Python • Опыт работы с облачными платформами (AWS, Azure, GCP) • Знание Docker, Kubernetes и CI/CD инструментов • Управление ресурсами и оптимизация затрат • Автоматизация процессов развертывания и масштабирования • Интеграция систем мониторинга и оповещения • Обеспечение безопасности и производительности LLM систем • Преимуществом будут опыт работы на ML-проекте, понимание архитектуры генеративного ИИ и работы с LLM Обязанности кандидата: • Разработка и управление LLM пайплайнами для обработки данных, развертывания моделей • Автоматизация LLM задач с использованием CI/CD и контейнерных технологий • Настройка систем мониторинга для отслеживания производительности моделей • Оптимизация инфраструктуры и конфигурация больших языковых моделей для высоких нагрузок • Анализ требований проекта и оценка необходимых аппаратных ресурсов • Мониторинг использования ресурсов и планирование масштабирования инфраструктуры Контактная информация: Тг: @HR7RedLines Эл.почта: [email protected]

GitHub Trends

@githubtrending · Post #15326 · 11.12.2025 г., 11:30

#python#agents#gcp#gemini#genai_agents#generative_ai#llmops#mlops#observability You can quickly create and deploy AI agents using the Agent Starter Pack, a Python package with ready-made templates and full infrastructure on Google Cloud. It handles everything except your agent’s logic, including deployment, monitoring, security, and CI/CD pipelines. You can start a project in just one minute, customize agents for tasks like document search or real-time chat, and extend them as needed. This saves you time and effort by providing production-ready tools and integration with Google Cloud services, letting you focus on building smart AI agents without worrying about backend setup or deployment details. https://github.com/GoogleCloudPlatform/agent-starter-pack

GitHub Trends

@githubtrending · Post #14868 · 26.06.2025 г., 12:00

#typescript#ai_gateway#gateway#generative_ai#hacktoberfest#langchain#llama_index#llmops#llms#openai#prompt_engineering#router The AI Gateway by Portkey lets you connect to over 1600 AI models quickly and securely through one simple API, making it easy to integrate any language, vision, or audio AI model in under two minutes. It ensures fast responses with less than 1ms latency, automatic retries, load balancing, and fallback options to keep your AI apps reliable and scalable. It also offers strong security with role-based access, guardrails, and compliance with standards like SOC2 and GDPR. You can save costs with smart caching and optimize usage without changing your code. This helps you build powerful, cost-effective, and secure AI applications faster and with less hassle. https://github.com/Portkey-AI/gateway

GitHub Trends

@githubtrending · Post #14661 · 02.05.2025 г., 11:30

#typescript#ai#analytics#datasets#dspy#evaluation#gpt#llm#llmops#low_code#observability#openai#prompt_engineering LangWatch helps you monitor, test, and improve AI applications by tracking performance, comparing different setups, and optimizing prompts automatically. It works with any AI tool or framework, keeps your data secure, and lets you collaborate with experts to fix issues quickly, making your AI more reliable and efficient. https://github.com/langwatch/langwatch

GitHub Trends

@githubtrending · Post #14808 · 08.06.2025 г., 13:00

#rust#ai#ai_engineering#anthropic#artificial_intelligence#deep_learning#genai#generative_ai#gpt#large_language_models#llama#llm#llmops#llms#machine_learning#ml#ml_engineering#mlops#openai#python#rust TensorZero is a free, open-source tool that helps you build and improve large language model (LLM) applications by using real-world data and feedback. It gives you one simple API to connect with all major LLM providers, collects data from your app’s use, and lets you easily test and improve prompts, models, and strategies. You can see how your LLMs perform, compare different options, and make them smarter, faster, and cheaper over time—all while keeping your data private and under your control. This means you get better results with less effort and cost, and your apps keep improving as you use them[1][2][3]. https://github.com/tensorzero/tensorzero

GitHub Trends

@githubtrending · Post #15521 · 25.02.2026 г., 11:30

#rust#ai_gateway#ai_gateway_support#envoy#envoyproxy#gateway#generative_ai#llm_gateway#llm_inference#llm_proxy#llm_routing#llmops#llms#openai#prompt#proxy#proxy_server#routing Plano is an AI-native proxy server that handles key tasks for agentic apps like routing between agents, smart LLM model selection, safety guardrails, and automatic traces for observability. Define agents in simple YAML, write basic HTTP code in any language, and start Plano to run multi-agent systems without custom plumbing or framework lock-in. You benefit by building and shipping reliable agents to production much faster, focusing on core logic while gaining safety, low latency, and easy scaling. https://github.com/katanemo/plano

GitHub Trends

@githubtrending · Post #14768 · 31.05.2025 г., 12:00

#typescript#ci#ci_cd#cicd#evaluation#evaluation_framework#llm#llm_eval#llm_evaluation#llm_evaluation_framework#llmops#pentesting#prompt_engineering#prompt_testing#prompts#rag#red_teaming#testing#vulnerability_scanners Promptfoo is a tool that helps developers test and improve AI applications using Large Language Models (LLMs). It allows you to **test prompts and models** automatically, **secure your apps** by finding vulnerabilities, and **compare different models** side-by-side. You can use it on your computer or integrate it into your development workflow. This tool helps you make sure your AI apps work well and are secure before you release them. It saves time and ensures quality by using data instead of guessing. https://github.com/promptfoo/promptfoo