#вакансия#mlops#engineer#llm#vllm#hugginface#rag#embeddings#k8s#docker#deckhouse#Langfuse#LlamaIndex#remote
Вакансия: MLOps-инженер
Компания: АО СимбирСофт
Формат работы: удалёнка
Занятость: полная занятость
Ищем MLOps инженера в РФ 👨💻
🚀 Нам нужен инженер, готовый развивать инфраструктуру LLM-платформы. Твоими задачами станут поддержка и развитие сервисов для больших языковых моделей, интеграция инструментов, настройка мониторингов и обеспечение безопасности данных.
🔍 Опыт работы с:
- Большими языковыми моделями (vLLM, TGI, Hugging Face)
- Python (FastAPI, скрипты, CLI)
- Архитектурой RAG и embedding-моделями
- Prometheus/Grafana
- Система аутентификации (Keycloak, JWT)
- Kubernetes, Docker, CI/CD
💡 Будут полезны знания:
- Deckhouse или других дистрибутивов Kubernetes
- Langfuse, LlamaIndex, PostgreSQL Vector, Chroma
- Принципов MLOps и интеграции сторонних API
✅Условия:
- Удаленный формат работы.
- Гибкое начало рабочего дня.
- Широкий технологический стек, сотни проектов. Можно разрабатывать IT-решения для разных отраслей, пробовать новые технологии.
- Помогаем прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком.
- Имеем развитую систему наставничества, проходим сертификацию за счет компании, участвуем в конференциях. Активно обмениваемся опытом, проводим внутренние и внешние митапы, прокачиваем hard и soft skills.
Присоединяйся к нам!✨
Если заинтересовала вакансия, буду рада обсудить в тг:
https://t.me/gulnara_s28 ʕ ᵔᴥᵔ ʔ
GitHub Trends@githubtrending · Post #15556 · 12.03.2026 г., 12:30
#typescript#ai#ai_agents#coding#deno#embeddings#insforge#nextjs#oauth2#pgvector#postgresql#realtime#vectors#websockets
InsForge is an open-source backend platform for AI coding agents, offering easy auth, Postgres database, S3 storage, edge functions, and model gateway via a simple semantic layer. Agents fetch context, configure services, and inspect state to build full-stack apps quickly. Set up locally with Docker or use cloud deploys. It boosts agent accuracy 1.7x, speed 1.6x, and cuts tokens 30% vs. rivals, letting you prototype and ship AI-driven apps faster with less hassle and cost.
https://github.com/InsForge/InsForge
GitHub Trends@githubtrending · Post #14800 · 07.06.2025 г., 11:30
#java#anthropic#chatgpt#chroma#embeddings#gemini#gpt#huggingface#java#langchain#llama#milvus#ollama#onnx#openai#openai_api#pgvector#pinecone#vector_database#weaviate
LangChain4j helps you add powerful AI to your Java applications by making it easy to use Large Language Models (LLMs). It provides a simple way to switch between different LLMs and embedding stores without needing to learn each one's specific API. This means you can easily experiment with different models and tools, making your development process faster and more flexible. LangChain4j also offers many examples and tools to help you build complex AI applications quickly, such as chatbots and retrieval systems. This simplifies the integration of AI into your projects, allowing you to focus on creating better applications.
https://github.com/langchain4j/langchain4j
GitHub Trends@githubtrending · Post #15253 · 30.10.2025 г., 12:30
#go#agent#agentic#ai#chatbot#chatbots#embeddings#evaluation#generative_ai#golang#knowledge_base#llm#multi_tenant#multimodel#ollama#openai#question_answering#rag#reranking#semantic_search#vector_search
WeKnora is a powerful tool that helps you understand and find answers in complex documents like PDFs and Word files. It uses advanced AI to read documents, understand what they mean, and answer your questions in a simple way. This tool is useful for businesses and researchers because it can quickly find information from many documents, making it easier to manage knowledge and make decisions. It also supports multiple languages and can be used privately, ensuring your data stays safe.
https://github.com/Tencent/WeKnora