TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #335 · 29 мар.

В Linux стандартными средствами можно использовать часть оперативной памяти как диск. Для этого требуется указать тип монтирования tmpfs в команде mount mount -t tmpfs -o size=5G tmpfs /mnt/ram Теперь путь /mnt/ram можно использовать как обычный каталог. Для чего это может быть нужно? ▫️ Скорость работы с таким каталогом выше чем многие SSD и тем более HDD. ▫️ Если у вас очень быстрый SSD на NVMe M.2 то такой способ особо не прибавит вам скорости, но поможет сохранить ресурс SSD когда требуется обрабатывать очень много мелких файлов и оперативка позволяет выделить нужный объем. ▫️ Оперативка это энергозависимая память, поэтому выключении питания все файлы безвозвратно теряются. Такой "non persistent" каталог гарантирует удаление временных файлов. Я написал небольшой скрипт для условного теста и сравнения скорости копирования файлов между SSD и RAM. Вот мои результаты: Single File Size: 30.0Gb ssd > ssd: 0:00:12.850 / 2.3Gb/s sdd > ram: 0:00:06.453 / 4.6Gb/s ram > ram: 0:00:06.995 / 4.3Gb/s ram > sdd: 0:00:06.217 / 4.8Gb/s Dir size: 32.7Gb, File count: 11127 ssd > ssd: 0:00:15.063 / 2.2Gb/s sdd > ram: 0:00:08.486 / 3.9Gb/s ram > ram: 0:00:08.032 / 4.1Gb/s ram > sdd: 0:00:07.026 / 4.7Gb/s Скрипт для теста ↗️ На моём железе прирост скорости ~2x. Плюс экономия ресурса SSD. В Windows такой фишки по умолчанию нет, но обязательно найдутся аналогичные решения #linux#triks

Hashtags

Резултати

Пронајдени 2 слични објави

Пребарај: #vllm

当前筛选 #vllm清除筛选
Data Science Jobs

@datasciencejobs · Post #3075 · 17.12.2025 г., 15:00

#вакансия#mlops#engineer#llm#vllm#hugginface#rag#embeddings#k8s#docker#deckhouse#Langfuse#LlamaIndex#remote Вакансия: MLOps-инженер Компания: АО СимбирСофт Формат работы: удалёнка Занятость: полная занятость Ищем MLOps инженера в РФ 👨‍💻 🚀 Нам нужен инженер, готовый развивать инфраструктуру LLM-платформы. Твоими задачами станут поддержка и развитие сервисов для больших языковых моделей, интеграция инструментов, настройка мониторингов и обеспечение безопасности данных. 🔍 Опыт работы с: - Большими языковыми моделями (vLLM, TGI, Hugging Face) - Python (FastAPI, скрипты, CLI) - Архитектурой RAG и embedding-моделями - Prometheus/Grafana - Система аутентификации (Keycloak, JWT) - Kubernetes, Docker, CI/CD 💡 Будут полезны знания: - Deckhouse или других дистрибутивов Kubernetes - Langfuse, LlamaIndex, PostgreSQL Vector, Chroma - Принципов MLOps и интеграции сторонних API ✅Условия: - Удаленный формат работы. - Гибкое начало рабочего дня. - Широкий технологический стек, сотни проектов. Можно разрабатывать IT-решения для разных отраслей, пробовать новые технологии. - Помогаем прокачаться во всех интересующих направлениях: стать тимлидом, архитектором, разработчиком. - Имеем развитую систему наставничества, проходим сертификацию за счет компании, участвуем в конференциях. Активно обмениваемся опытом, проводим внутренние и внешние митапы, прокачиваем hard и soft skills. Присоединяйся к нам!✨ Если заинтересовала вакансия, буду рада обсудить в тг: https://t.me/gulnara_s28 ʕ ᵔᴥᵔ ʔ

GitHub Trends

@githubtrending · Post #15433 · 23.01.2026 г., 14:30

#python#deepseek#demo#easy#embedding#flask#gpt#huggingface_transformers#llm#mcp#multimodal#openai#qwen#rag#sentence_transformers#ui#vllm#vlm UltraRAG is a lightweight framework that makes building retrieval-augmented generation (RAG) systems simple and fast. It uses a low-code approach where you write just dozens of lines of YAML configuration instead of complex code to create sophisticated AI workflows with conditional logic and loops. The framework includes a visual development environment where you can drag-and-drop to build pipelines, adjust parameters in real-time, and instantly convert your logic into interactive chat applications. This means you can deploy powerful AI systems that ground answers in your own data—reducing hallucinations and improving accuracy—without needing extensive coding expertise or lengthy development cycles. https://github.com/OpenBMB/UltraRAG