TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #157 · 12.01

На рынке удивительная ситуация с этим кризисом чипов: у людей есть деньги и желание купить товар, а у компаний есть производство и желание продать. Но товар не могут сделать и поставить. Кстати, что странно, компании даже в условиях дефицита не повышают официальную цену, хотя именно так капитализм должен был бы в норме решать эту проблему. В итоге, мы получаем паразитическую сторону капитализма — появляются перекупщики, которые делают наценку 50-100% и даже более. С автомобилями (да, новые автомобили тоже внезапно в кризисе) такая перепродажа, вероятно, не очень прокатывает. Но приставки и видеокарты попали под ситуацию очень заметно. В идеале и производителям и легальным магазинам нужно продать товар по возможности сразу целевому пользователю. Как это сделать? Магазины в России в конце прошлого года попробовали анализировать аккаунты покупателей и вручную звонить людям, попавшим под некий профиль (например, если человек купил много геймерских товаров), предлагая им PlayStation 5. Кажется, сработало это не очень хорошо. Во-первых, многие, кто очень хочет, так и остались без приставки. Люди буквально днями и неделями мониторят все возможные сайты в надежде поймать заветную «плойку». Иногда удается, но чаще нет. Во-вторых, магазины всё равно попадают на тех, кто в итоге продаст товар с наценкой. Например, два разных магазина могут продать одному и тому же человеку. Или — так было в моём случае — магазин предложил мне только дисковую версию, я её купил и продал ровно так, чтобы компенсировать наценку на бездисковую, которую на самом деле хотел. Впрочем, я купил бездисковую не у таких потерявших берега перекупщиков, какие обитают в России, а за границей, и наценка была небольшая относительно состояния рынка. И вот здесь привязка устройств к человеку по каким-нибудь идентификационным данным на самом деле могла бы сыграть в плюс. В магазине, кстати, приставку продали только при личной явке и только при предъявлении паспорта, и это после их же звонка с предложением. Но можно пойти дальше: прямо при покупке привязывать аккаунт к конкретной персоне, и так, чтобы его нельзя было отвязать, например, в течение года. Это конечно упрощённая и идеализированная модель, но суть ясна: сделать скорую перепродажу невыгодной или даже невозможной. Год назад казалось, что через год то уж точно приставки для всех будут. Я поэтому тогда и не купил. А в действительности через год стало только сложнее достать. Посмотрим, что будет ещё через год. #life#gadgets

Резултати

Намерени 8 подобни публикации

Търсене: #llmops

当前筛选 #llmops清除筛选
Data Science Jobs

@datasciencejobs · Post #2244 · 02.08.2024 г., 18:03

#вакансия#Москва#senior#mlops#ml#llmops#devops#mle Мы - международная компания, лаборатория продуктов, где мы стремится стать лидерами в области VR/XR, web3, машинного обучения и нейронных сетей. Компания разрабатывает и внедряет революционные решения, устанавливая новые стандарты и вдохновляя на достижение невозможного в области информационных технологий. Наша команда - это открытый, заряженный и молодой коллектив, который приветствует инновационные идеи и поддерживает инициативу и творчество наших сотрудников. Один из приоритетных продуктов нашей компании - внутренний стартап GenAI (на ранней стадии), в который сейчас ищем Senior ML Ops. Мы запускаем целую линейку инновационных продуктов (B2B, B2C сервисы полностью на основе ИИ), которые уже влияют на эволюцию генеративного ИИ в мире. Какие задачи вас ждут: - Разработка с нуля MLOps для задач генерации аудиоконтента, генерации видеоконтента, исполнения LLM: среды разработки, тестирования, инференса и мониторинга моделей в различных режимах (Batch, Streaming) и использования ресурсов (CPU, GPU); Deploy моделей в продакшн; - Внедрение инструментов отслеживания жизненного цикла моделей и версионирования модельных артефактов (ClearML, MLFlow, DVC и т.п.); - Развитие LLMOps-практик (эффективный инференс LLM, Diffusion Models). Мы ждем, что вы: - Имеете опыт работы в качестве DevOps/MLOps/MLE -Engineer не менее 2 лет; - Имеете опыт работы с k8s, уметь разрабатывать и поддерживать сервисы в этой среде; - Имеете опыт разработки высоконагруженных сервисов; - Имеете опыт развертывания и использования MLOps инструментов (ClearML, DVC, MLflow и т.п.); - Имеете опыт выстраивания CI/CD; - Имеете опыт деплоя моделей в формате ONNX; - Знаете принципов организации распределеаюнных информационных систем и баз данных. Что мы предлагаем: - Вилка: 4k$ - 5k$ - Сильная команда, с которой можно расти; - Работа над задачами, которые до вас никто не решал; - Возможность присоединится в компанию у самых ее истоков; - Офис в Москва Сити; - Гибкое начало рабочего дня (до 10:00); - Sick days; - Медицинская страховка; - Реферальная программа. По всем вопросам обращайтесь к @IraRozhnova

Data Science Jobs

@datasciencejobs · Post #2900 · 03.09.2025 г., 10:03

#работа#удаленнаяработа#вакансия#LLMOps#ML#middle#Kubernetes#DevOps#LLM Позиция: LLMOps-инженер Полная занятость График: 5/2 Формат работы: удалённо Компания: 7RedLines Оформление: ТК РФ Оклад на руки: 200 000 – 300 000к Требования к кандидату: • Высшее образование: техническое, математическое и тд. • Опыт работы DevOps инженером от 3х лет • Опыт в DevOps, MLOps или backend • Уверенное владение Python • Опыт работы с облачными платформами (AWS, Azure, GCP) • Знание Docker, Kubernetes и CI/CD инструментов • Управление ресурсами и оптимизация затрат • Автоматизация процессов развертывания и масштабирования • Интеграция систем мониторинга и оповещения • Обеспечение безопасности и производительности LLM систем • Преимуществом будут опыт работы на ML-проекте, понимание архитектуры генеративного ИИ и работы с LLM Обязанности кандидата: • Разработка и управление LLM пайплайнами для обработки данных, развертывания моделей • Автоматизация LLM задач с использованием CI/CD и контейнерных технологий • Настройка систем мониторинга для отслеживания производительности моделей • Оптимизация инфраструктуры и конфигурация больших языковых моделей для высоких нагрузок • Анализ требований проекта и оценка необходимых аппаратных ресурсов • Мониторинг использования ресурсов и планирование масштабирования инфраструктуры Контактная информация: Тг: @HR7RedLines Эл.почта: [email protected]

GitHub Trends

@githubtrending · Post #15326 · 11.12.2025 г., 11:30

#python#agents#gcp#gemini#genai_agents#generative_ai#llmops#mlops#observability You can quickly create and deploy AI agents using the Agent Starter Pack, a Python package with ready-made templates and full infrastructure on Google Cloud. It handles everything except your agent’s logic, including deployment, monitoring, security, and CI/CD pipelines. You can start a project in just one minute, customize agents for tasks like document search or real-time chat, and extend them as needed. This saves you time and effort by providing production-ready tools and integration with Google Cloud services, letting you focus on building smart AI agents without worrying about backend setup or deployment details. https://github.com/GoogleCloudPlatform/agent-starter-pack

GitHub Trends

@githubtrending · Post #14868 · 26.06.2025 г., 12:00

#typescript#ai_gateway#gateway#generative_ai#hacktoberfest#langchain#llama_index#llmops#llms#openai#prompt_engineering#router The AI Gateway by Portkey lets you connect to over 1600 AI models quickly and securely through one simple API, making it easy to integrate any language, vision, or audio AI model in under two minutes. It ensures fast responses with less than 1ms latency, automatic retries, load balancing, and fallback options to keep your AI apps reliable and scalable. It also offers strong security with role-based access, guardrails, and compliance with standards like SOC2 and GDPR. You can save costs with smart caching and optimize usage without changing your code. This helps you build powerful, cost-effective, and secure AI applications faster and with less hassle. https://github.com/Portkey-AI/gateway

GitHub Trends

@githubtrending · Post #14661 · 02.05.2025 г., 11:30

#typescript#ai#analytics#datasets#dspy#evaluation#gpt#llm#llmops#low_code#observability#openai#prompt_engineering LangWatch helps you monitor, test, and improve AI applications by tracking performance, comparing different setups, and optimizing prompts automatically. It works with any AI tool or framework, keeps your data secure, and lets you collaborate with experts to fix issues quickly, making your AI more reliable and efficient. https://github.com/langwatch/langwatch

GitHub Trends

@githubtrending · Post #14808 · 08.06.2025 г., 13:00

#rust#ai#ai_engineering#anthropic#artificial_intelligence#deep_learning#genai#generative_ai#gpt#large_language_models#llama#llm#llmops#llms#machine_learning#ml#ml_engineering#mlops#openai#python#rust TensorZero is a free, open-source tool that helps you build and improve large language model (LLM) applications by using real-world data and feedback. It gives you one simple API to connect with all major LLM providers, collects data from your app’s use, and lets you easily test and improve prompts, models, and strategies. You can see how your LLMs perform, compare different options, and make them smarter, faster, and cheaper over time—all while keeping your data private and under your control. This means you get better results with less effort and cost, and your apps keep improving as you use them[1][2][3]. https://github.com/tensorzero/tensorzero

GitHub Trends

@githubtrending · Post #15521 · 25.02.2026 г., 11:30

#rust#ai_gateway#ai_gateway_support#envoy#envoyproxy#gateway#generative_ai#llm_gateway#llm_inference#llm_proxy#llm_routing#llmops#llms#openai#prompt#proxy#proxy_server#routing Plano is an AI-native proxy server that handles key tasks for agentic apps like routing between agents, smart LLM model selection, safety guardrails, and automatic traces for observability. Define agents in simple YAML, write basic HTTP code in any language, and start Plano to run multi-agent systems without custom plumbing or framework lock-in. You benefit by building and shipping reliable agents to production much faster, focusing on core logic while gaining safety, low latency, and easy scaling. https://github.com/katanemo/plano

GitHub Trends

@githubtrending · Post #14768 · 31.05.2025 г., 12:00

#typescript#ci#ci_cd#cicd#evaluation#evaluation_framework#llm#llm_eval#llm_evaluation#llm_evaluation_framework#llmops#pentesting#prompt_engineering#prompt_testing#prompts#rag#red_teaming#testing#vulnerability_scanners Promptfoo is a tool that helps developers test and improve AI applications using Large Language Models (LLMs). It allows you to **test prompts and models** automatically, **secure your apps** by finding vulnerabilities, and **compare different models** side-by-side. You can use it on your computer or integrate it into your development workflow. This tool helps you make sure your AI apps work well and are secure before you release them. It saves time and ensures quality by using data instead of guessing. https://github.com/promptfoo/promptfoo