TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14907 · Jul 3

#python#agents#generative_ai_tools#llamacpp#llm#onnx#openvino#parsing#retrieval_augmented_generation#small_specialized_models llmware is a powerful, easy-to-use platform that helps you build AI applications using small, specialized language models designed for business tasks like question-answering, summarization, and data extraction. It supports private, secure deployment on your own machines without needing expensive GPUs, making it cost-effective and safe for enterprise use. You can organize and search your documents, run smart queries, and combine knowledge with AI to get accurate answers quickly. It also offers many ready-to-use models and examples, plus tools for building chatbots and agents that automate complex workflows. This helps you save time, improve accuracy, and securely leverage AI for your business needs[1][3][5]. https://github.com/llmware-ai/llmware

Results

2 similar posts found

Search: #vllm

当前筛选 #vllm清除筛选
Data Science Jobs

@datasciencejobs · Post #3075 · 12/17/2025, 03:00 PM

#вакансия#mlops#engineer#llm#vllm#hugginface#rag#embeddings#k8s#docker#deckhouse#Langfuse#LlamaIndex#remote Вакансия: MLOps-инженер Компания: АО СимбирСофт Формат работы: удалёнка Занятость: полная занятость Ищем MLOps инженера в РФ 👨‍💻 🚀 Нам нужен инженер, готовый развивать инфраструктуру LLM-платформы. Твоими задачами станут поддержка и развитие сервисов для больших языковых моделей, интеграция инструментов, настройка мониторингов и обеспечение безопасности данных. 🔍 Опыт работы с: - Большими языковыми моделями (vLLM, TGI, Hugging Face) - Python (FastAPI, скрипты, CLI) - Архитектурой RAG и embedding-моделями - Prometheus/Grafana - Система аутентификации (Keycloak, JWT) - Kubernetes, Docker, CI/CD 💡 Будут полезны знания: - Deckhouse или других дистрибутивов Kubernetes - Langfuse, LlamaIndex, PostgreSQL Vector, Chroma - Принципов MLOps и интеграции сторонних API ✅Условия: - Удаленный формат работы. - Гибкое начало рабочего дня. - Широкий технологический стек, сотни проектов. Можно разрабатывать IT-решения для разных отраслей, пробовать новые технологии. - Помогаем прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком. - Имеем развитую систему наставничества, проходим сертификацию за счет компании, участвуем в конференциях. Активно обмениваемся опытом, проводим внутренние и внешние митапы, прокачиваем hard и soft skills. Присоединяйся к нам!✨ Если заинтересовала вакансия, буду рада обсудить в тг: https://t.me/gulnara_s28 ʕ ᵔᴥᵔ ʔ

GitHub Trends

@githubtrending · Post #15433 · 01/23/2026, 02:30 PM

#python#deepseek#demo#easy#embedding#flask#gpt#huggingface_transformers#llm#mcp#multimodal#openai#qwen#rag#sentence_transformers#ui#vllm#vlm UltraRAG is a lightweight framework that makes building retrieval-augmented generation (RAG) systems simple and fast. It uses a low-code approach where you write just dozens of lines of YAML configuration instead of complex code to create sophisticated AI workflows with conditional logic and loops. The framework includes a visual development environment where you can drag-and-drop to build pipelines, adjust parameters in real-time, and instantly convert your logic into interactive chat applications. This means you can deploy powerful AI systems that ground answers in your own data—reducing hallucinations and improving accuracy—without needing extensive coding expertise or lengthy development cycles. https://github.com/OpenBMB/UltraRAG