探索号@seeker_rc · Post #20516 · 05/14/2026, 06:25 AM
我最近 vibe 了一个 pod 级别的智能运维工具!希望大家使用在给点反馈
我最近开发了一个运维 agent ,我想让大家体验和使用下效果怎么样。
————————
📌 这个是智能核心
<https://github.com/mumong/aiops-pod>
📌 这个是工具 mcp
<https://github.com/mumong/mcpServer-holmesgpt>
📌 这个是可观测性的部署。里面包含了上面要用到的 prometheus 工具
<https://github.com/mumong/Observility>
使用方式为,将上面 2 个资源拉下来 然后部署到 k8s 集群,如果想要工具完整性的话可能还需要适配一个 prometheus...
via V2EX 分享创造
标签: #prometheus#部署#工具
⚡️探索号频道
⚡️探索者频道
⚡️探索者交流群
⚡️ Youtube 频道:科技探索者
每天推荐有趣内容,欢迎订阅、转发。
Bookmark@bookmarktutorial · Post #1670 · 01/27/2022, 12:26 AM
祝大家在即将到来的虎年里:
服务器永不宕机
Pod 永不 Pending
#Etcd 永远健康
#KubeSphere Console 登录密码一直正确
应用负载一直可用
容器镜像永远不会拉不下来
#CoreDNS 一直正常解析
ks-apiserver 永不失联
存储卷挂载一直成功
监控数据永不丢失
#Prometheus 永不报警
#vacancy#Fulltime#remote#MLOps#Jenkins#ITВакансии#УдалённаяРабота#Prometheus#Вакансия
🔎Senior MLOps в крупный ритейлер.
💰Зарплата: 240-270К руб/мес.Гросс
🎯Локация/гр.: Россия
🕰Срок проекта: 6 месяцев +
📄Оформление: только ИП
📌 Требования:
- Опыт работы с Kubernetes и облачными/on-prem кластерами;
- Знание Python и инструментов ML Ops (Kubeflow, Airflow);
- Опыт настройки CI/CD (Jenkins);
- Опыт работы с системами хранения и векторными БД (Weaviate/Qdrant/PGVector);
- Знания в области мониторинга и логирования (Prometheus, Grafana, ELK, OpenTelemetry).
✅Задачи:
- Развертывание и поддержка LLM-платформы в Kubernetes (Helm, Terraform, K8s Operators);
- Настройка CI/CD для ML/AI сервисов (обучение, inference, data pipelines);
- Автоматизация ML workflow в Kubeflow;
- Настройка и поддержка мониторинга моделей (latency, drift, cost metrics);
- Управление пайплайнами данных для обучения и inference (Kafka, DataLake, объектное хранилище S3, векторные БД);
- Оптимизация работы GPU-кластера (распределённое обучение, эффективное использование ресурсов);
- Обеспечение безопасности и комплаенса: изоляция сред, контроль доступа, логирование.
🏛О проекте:
Разработка внутренней корпоративной LLM-платформы для автоматизации процессов, поддержки сотрудников и повышения эффективности взаимодействия с данными. В задачи проекта входит создание удобных пользовательских интерфейсов (чат-ассистенты, RAG-поиск, генерация текстов и изображений), интеграция с существующими системами компании и обеспечение контроля и мониторинга использования модели.
📲Как откликнуться:
Отправляйте своё резюме @AllaDemHR
GitHub Trends@githubtrending · Post #14846 · 06/20/2025, 12:00 PM
#go#cloudnative#grafana#hacktoberfest#logging#loki#prometheus
Loki is a log aggregation system inspired by Prometheus but designed specifically for logs instead of metrics. It is cost-effective and easy to operate because it only indexes metadata (labels) about logs, not the full log content, which reduces storage and complexity. Loki works well with Kubernetes by automatically indexing pod labels and integrates natively with Grafana for easy log visualization. Its stack includes an agent (Alloy) to collect logs, Loki to store and query them, and Grafana to display them. This setup helps you efficiently manage and analyze logs with less cost and simpler operation compared to traditional logging systems[2].
https://github.com/grafana/loki
Рубрика: КодМашины
🔥 ИИ-революция 2025: как Альтман, Безос и Белый дом перезапускают науку
Конец года взорвался новыми амбициозными проектами — от частных инициатив до государственных мегапрограмм. Вот что происходит:
🚀Ключевые игроки и их стратегии:
1. Episteme (Сэм Альтман)
- Цель: создать «новый тип R&D-организации» для поддержки рискованных, междисциплинарных идей, которые отвергают традиционные институты.
- Философия: сознательно менять «эпистему» эпохи — систему идей, определяющих мышление. Ссылаются на Фуко, Коперника и Медичи.
- Фокус: фундаментальные исследования без бюрократии и коммерческого давления.
2. Project Prometheus (Джефф Безос)
- Инвестиции: $6,2 млрд.
- Направление: ИИ для физических задач — робототехника, аэрокосмос, автоиндустрия (конкуренция с Маском?).
- Команда: почти 100 человек из Meta, OpenAI, DeepMind. Безос — содиректор.
3. Миссия Генезис (Белый дом)
- Масштаб: национальный проект уровня «Манхэттенского».
- Цель: ускорить научный прогресс через ИИ — от материаловедения до космоса.
- Контекст: «поворотный момент», требующий исторических усилий.
4. Стартап Яна Лекуна
- Критика: языковые модели (вроде ChatGPT) — тупик, так как не понимают физический мир, не умеют рассуждать и планировать.
- Цель: следующая ИИ-революция — системы с памятью, логикой и способностью к абстракции.
💡 Почему это важно?
- Смена парадигмы: Акцент смещается с чисто цифровых моделей (NLP) на ИИ для реального мира — робототехника, наука, инженерия.
- Гонка инвестиций: Частные капиталы ($6,2 млрд у Безоса) и государственные ресурсы (США) объединяются для прорыва.
- Кризис традиционной науки: Episteme и Лекун прямо указывают на ограничения академической системы — бюрократия, узкая специализация, избегание риска.
📈 Куда движется рынок?
- Прорывы ожидаются в областях:
- Наука + ИИ: ускорение открытий (например, новые материалы).
- Киберфизические системы: роботы, автономные транспортные средства, космос.
- ИИ с рассуждением: переход от статистических моделей к системам с логикой и памятью.
#ИИ#Наука#Инновации#R&D #Episteme#Prometheus#МиссияГенезис#Лекун
🌐@EconRUDN
GitHub Trends@githubtrending · Post #14992 · 07/23/2025, 01:00 PM
#go#aws#azure#cncf#cost#cost_optimization#finops#gcp#k8s#kubernetes#monitoring#opencost#prometheus
OpenCost is a free, open-source tool that helps you see and understand the costs of running Kubernetes clusters and cloud services in real time. It breaks down costs by cluster, node, namespace, pod, and more, across multiple cloud providers like AWS, Azure, and GCP, and even supports on-premises setups. This lets you track where your money is going, spot expensive resources, and manage your cloud spending better. It integrates with Prometheus for metrics and offers a user-friendly web interface and APIs for easy cost monitoring and exporting. Using OpenCost helps you control and optimize your cloud and Kubernetes expenses efficiently[1][2][3][4].
https://github.com/opencost/opencost