TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #79 · 24.09

Год назад 24 сентября 2020 Сбер презентовал свой ребрендинг и платформу с умными ассистентами. Я и тогда высказался об этом довольно позитивно, а теперь я уже некоторое время вовлечён в разработку под неё, и она даже стала источником крупнейшего в моей жизни единовременного денежного выигрыша. Вообще, я не скрываю своего скептицизма по отношению к строительству экосистем и так называемых супераппов. У нас всех уже есть суперапп -- операционная система на смартфоне или компьютере. Совершенно непонятно, почему пользователь должен запускать что-то внутри другого приложения, если может просто иметь себе отдельно такое приложение в телефоне. Пока что в общемировой практике сработал только WeChat в Китае, но там это произошло, судя по всему, из-за своеобразного местного законодательства с его запретами. В России ближе всего к супераппам подошёл ВК, и здесь у них есть два сильнейших преимущества: - соцсеть изначально многоцелевая (в отличие, например, от поисковика или банковского клиента), поэтому пользователи привыкли заниматься здесь разными вещами - социальный граф, отлично способствующий вирусному распространению И даже с такими вводными у ВК пока не вышло убедить массовую аудиторию в необходимости пользоваться встроенными аппами для разных целей. Пользователи есть или у продуктов, созданных как раз вокруг социального графа и других средств социальной сети (опросники и тесты для друзей, статистика страницы итд), или у продуктов, поддерживаемых внешним бизнесом, в том числе самим ВК (такси, алиэкспресс, пиццерия). Нет даже близко речи о том, чтобы вы внутри ВКонтакте запускали, например, фоторедактор или менеджер задач. Даже моё приложение Promenade, которое вы массово репостили и очень хвалили, имеет около нуля активных юзеров. Среди моих друзей и знакомых никто систематически не пользуется ни одним миниаппом, а модерация самого ВК советовала мне превратить одно из приложений в игру, потому что игры популярнее и востребованнее. Так что, возвращаясь к Сберу, ещё более дико выглядит мысль о том, что человек будет запускать приложение внутри банковского клиента, если это приложение не связано с финансами. А у Сбера ещё и сами приложения довольно специфические — поверх любого отрисовывается голосовой ассистент, который должен быть в каком-то виде поддержан, даже там, где в принципе голосовой ввод не предполагается. И у приложений нет доступа к аппаратуре телефона, например, к камере (хотя со временем это добавят). Так что сейчас в сберовском "Салюте" перекати поле в плане количества юзеров. Но этот вопрос должны решать маркетологи и прочие рекламщики. Если предположить, что устойчивая модель супераппа в принципе возможна в России, то у них наверняка есть план. Я не понимаю, какой, и как возможно убедить людей, но не тратят же они в самом деле миллиардные бюджеты на попытку вслепую и из-за моды? :) Зато я разбираюсь в технической составляющей, и немного -- в продуктовой. И могу сказать, что с этой позиции у площадки Сбера всё прям очень хорошо. Я в восторге от многих вещей, как технических, так и продуктовых. На платформе приятно разрабатывать, её правильно и своевременно обновляют, и, конечно же, очень классно взаимодействовать с сообществом, о котором я уже отзывался в статье. На вопросы отвечают быстро, баги реально берут в работу и исправляют за адекватное время. Для меня за прошедший год Сбер открылся с новой стороны. Посмотрим, что будет ещё через год. #dev

Hashtags

Резултати

Намерени 8 подобни публикации

Търсене: #llmops

当前筛选 #llmops清除筛选
Data Science Jobs

@datasciencejobs · Post #2244 · 02.08.2024 г., 18:03

#вакансия#Москва#senior#mlops#ml#llmops#devops#mle Мы - международная компания, лаборатория продуктов, где мы стремится стать лидерами в области VR/XR, web3, машинного обучения и нейронных сетей. Компания разрабатывает и внедряет революционные решения, устанавливая новые стандарты и вдохновляя на достижение невозможного в области информационных технологий. Наша команда - это открытый, заряженный и молодой коллектив, который приветствует инновационные идеи и поддерживает инициативу и творчество наших сотрудников. Один из приоритетных продуктов нашей компании - внутренний стартап GenAI (на ранней стадии), в который сейчас ищем Senior ML Ops. Мы запускаем целую линейку инновационных продуктов (B2B, B2C сервисы полностью на основе ИИ), которые уже влияют на эволюцию генеративного ИИ в мире. Какие задачи вас ждут: - Разработка с нуля MLOps для задач генерации аудиоконтента, генерации видеоконтента, исполнения LLM: среды разработки, тестирования, инференса и мониторинга моделей в различных режимах (Batch, Streaming) и использования ресурсов (CPU, GPU); Deploy моделей в продакшн; - Внедрение инструментов отслеживания жизненного цикла моделей и версионирования модельных артефактов (ClearML, MLFlow, DVC и т.п.); - Развитие LLMOps-практик (эффективный инференс LLM, Diffusion Models). Мы ждем, что вы: - Имеете опыт работы в качестве DevOps/MLOps/MLE -Engineer не менее 2 лет; - Имеете опыт работы с k8s, уметь разрабатывать и поддерживать сервисы в этой среде; - Имеете опыт разработки высоконагруженных сервисов; - Имеете опыт развертывания и использования MLOps инструментов (ClearML, DVC, MLflow и т.п.); - Имеете опыт выстраивания CI/CD; - Имеете опыт деплоя моделей в формате ONNX; - Знаете принципов организации распределеаюнных информационных систем и баз данных. Что мы предлагаем: - Вилка: 4k$ - 5k$ - Сильная команда, с которой можно расти; - Работа над задачами, которые до вас никто не решал; - Возможность присоединится в компанию у самых ее истоков; - Офис в Москва Сити; - Гибкое начало рабочего дня (до 10:00); - Sick days; - Медицинская страховка; - Реферальная программа. По всем вопросам обращайтесь к @IraRozhnova

Data Science Jobs

@datasciencejobs · Post #2900 · 03.09.2025 г., 10:03

#работа#удаленнаяработа#вакансия#LLMOps#ML#middle#Kubernetes#DevOps#LLM Позиция: LLMOps-инженер Полная занятость График: 5/2 Формат работы: удалённо Компания: 7RedLines Оформление: ТК РФ Оклад на руки: 200 000 – 300 000к Требования к кандидату: • Высшее образование: техническое, математическое и тд. • Опыт работы DevOps инженером от 3х лет • Опыт в DevOps, MLOps или backend • Уверенное владение Python • Опыт работы с облачными платформами (AWS, Azure, GCP) • Знание Docker, Kubernetes и CI/CD инструментов • Управление ресурсами и оптимизация затрат • Автоматизация процессов развертывания и масштабирования • Интеграция систем мониторинга и оповещения • Обеспечение безопасности и производительности LLM систем • Преимуществом будут опыт работы на ML-проекте, понимание архитектуры генеративного ИИ и работы с LLM Обязанности кандидата: • Разработка и управление LLM пайплайнами для обработки данных, развертывания моделей • Автоматизация LLM задач с использованием CI/CD и контейнерных технологий • Настройка систем мониторинга для отслеживания производительности моделей • Оптимизация инфраструктуры и конфигурация больших языковых моделей для высоких нагрузок • Анализ требований проекта и оценка необходимых аппаратных ресурсов • Мониторинг использования ресурсов и планирование масштабирования инфраструктуры Контактная информация: Тг: @HR7RedLines Эл.почта: [email protected]

GitHub Trends

@githubtrending · Post #15326 · 11.12.2025 г., 11:30

#python#agents#gcp#gemini#genai_agents#generative_ai#llmops#mlops#observability You can quickly create and deploy AI agents using the Agent Starter Pack, a Python package with ready-made templates and full infrastructure on Google Cloud. It handles everything except your agent’s logic, including deployment, monitoring, security, and CI/CD pipelines. You can start a project in just one minute, customize agents for tasks like document search or real-time chat, and extend them as needed. This saves you time and effort by providing production-ready tools and integration with Google Cloud services, letting you focus on building smart AI agents without worrying about backend setup or deployment details. https://github.com/GoogleCloudPlatform/agent-starter-pack

GitHub Trends

@githubtrending · Post #14868 · 26.06.2025 г., 12:00

#typescript#ai_gateway#gateway#generative_ai#hacktoberfest#langchain#llama_index#llmops#llms#openai#prompt_engineering#router The AI Gateway by Portkey lets you connect to over 1600 AI models quickly and securely through one simple API, making it easy to integrate any language, vision, or audio AI model in under two minutes. It ensures fast responses with less than 1ms latency, automatic retries, load balancing, and fallback options to keep your AI apps reliable and scalable. It also offers strong security with role-based access, guardrails, and compliance with standards like SOC2 and GDPR. You can save costs with smart caching and optimize usage without changing your code. This helps you build powerful, cost-effective, and secure AI applications faster and with less hassle. https://github.com/Portkey-AI/gateway

GitHub Trends

@githubtrending · Post #14661 · 02.05.2025 г., 11:30

#typescript#ai#analytics#datasets#dspy#evaluation#gpt#llm#llmops#low_code#observability#openai#prompt_engineering LangWatch helps you monitor, test, and improve AI applications by tracking performance, comparing different setups, and optimizing prompts automatically. It works with any AI tool or framework, keeps your data secure, and lets you collaborate with experts to fix issues quickly, making your AI more reliable and efficient. https://github.com/langwatch/langwatch

GitHub Trends

@githubtrending · Post #14808 · 08.06.2025 г., 13:00

#rust#ai#ai_engineering#anthropic#artificial_intelligence#deep_learning#genai#generative_ai#gpt#large_language_models#llama#llm#llmops#llms#machine_learning#ml#ml_engineering#mlops#openai#python#rust TensorZero is a free, open-source tool that helps you build and improve large language model (LLM) applications by using real-world data and feedback. It gives you one simple API to connect with all major LLM providers, collects data from your app’s use, and lets you easily test and improve prompts, models, and strategies. You can see how your LLMs perform, compare different options, and make them smarter, faster, and cheaper over time—all while keeping your data private and under your control. This means you get better results with less effort and cost, and your apps keep improving as you use them[1][2][3]. https://github.com/tensorzero/tensorzero

GitHub Trends

@githubtrending · Post #15521 · 25.02.2026 г., 11:30

#rust#ai_gateway#ai_gateway_support#envoy#envoyproxy#gateway#generative_ai#llm_gateway#llm_inference#llm_proxy#llm_routing#llmops#llms#openai#prompt#proxy#proxy_server#routing Plano is an AI-native proxy server that handles key tasks for agentic apps like routing between agents, smart LLM model selection, safety guardrails, and automatic traces for observability. Define agents in simple YAML, write basic HTTP code in any language, and start Plano to run multi-agent systems without custom plumbing or framework lock-in. You benefit by building and shipping reliable agents to production much faster, focusing on core logic while gaining safety, low latency, and easy scaling. https://github.com/katanemo/plano

GitHub Trends

@githubtrending · Post #14768 · 31.05.2025 г., 12:00

#typescript#ci#ci_cd#cicd#evaluation#evaluation_framework#llm#llm_eval#llm_evaluation#llm_evaluation_framework#llmops#pentesting#prompt_engineering#prompt_testing#prompts#rag#red_teaming#testing#vulnerability_scanners Promptfoo is a tool that helps developers test and improve AI applications using Large Language Models (LLMs). It allows you to **test prompts and models** automatically, **secure your apps** by finding vulnerabilities, and **compare different models** side-by-side. You can use it on your computer or integrate it into your development workflow. This tool helps you make sure your AI apps work well and are secure before you release them. It saves time and ensures quality by using data instead of guessing. https://github.com/promptfoo/promptfoo