TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #884 · 5.10

Роскосмос пару дней назад опубликовал отчёт о том, почему упала "Луна-25". Там конечно канцелярит, но можно примерно понять, что двигатель коррекции получил неверные данные от акселерометра: из-за возможного попадания в один массив данных команд с различными приоритетами их исполнения прибором Это очень похоже на программную ошибку, а это моя сфера, и я решил над ситуацией поразмыслить. Хейтеры сразу стали строчить комментарии в стиле "Ололо, наняли каких-то идиотов, которые простейшие тесты не провели". Тут обычно справедливо вспоминают аварию с европейской ракетой Ариан-5 в 1996 году. Там буквально из-за пары строчек кода в результате неправильного приведения числовых типов ракета за 7 млрд баксов развалилась на куски в воздухе. Бывает. Что касается Роскосмоса, при всей его сомнительной репутации, объяснение "Дураки не провели тесты" звучит лично для меня неправдоподобно. На мой личный взгляд возможны два варианта: 1. Если в описании ошибки слово "приоритет" обозначает какой-то признак внутри объекта команды, значит, на входе в приёмный модуль эти команды не были отфильтрованы. Выглядит как грубая ошибка, целый логический блок упущен. Вряд ли этот блок вообще не написан, скорее всего он не выполнился. Такое бывает, если в тестовой среде есть какое-то условие, которого нет в рабочей, и именно это условие отвечает за выполнение участка кода. Сталкивался с таким миллион раз. Самое дикое из последнего: код парсит эксель-таблицу с числами. Разработчик написал, запустил проверил, прогнал тесты, всё ок. Отправляем в прод — все числа будто бы рандомно меняются на другие. Запускаем снова — у всех разработчиков функционирует нормально, а в проде на сервере нет. Таблица одна и та же. Можете подумать, почему так. Ответ: у разработчиков стоит русская локаль и десятичный разделитесь это запятая, а на проде в докере точка. При парсинге на проде запятая уже интерпретируется как разделитель тысячных разрядов. 2. Куда вероятнее, что слово "приоритет" в описании ошибки обозначает время, а, значит, список команд просто не был отсортирован, и в обработчик уже после актуальных значений попали какие-нибудь начальные нулевые данные, сбившие логику. По косвенному описанию проблемы очень похоже именно на это. Значит, на тестах всегда порядок возникновения команд соответствовал порядку их прихода, а в реальности перестал соответствовать. Вообще, работать с железом очень сложно. Какую-нибудь схемку заглючило от холода, она задержала ответ от датчика на миллисекунду, и всё. Никто не знал, что такая проблема возможна, пока она не возникла. Мне рассказывали о таком случае: юзер логинится на сайт и иногда логин проходит, а иногда нет. Логин и пароль те же самые. Просто в случайные моменты времени ему возвращают токен авторизации, а в другие моменты времени ошибку 403. Никакой закономерности нет вообще. Нет зависимости от времени суток и даты. Сервер точно работает стабильно и не падает все 100% времени. Почему так может быть? Ответ: у сервиса авторизации два инстанса, перед которыми балансировщик нагрузки. В одном инстансе данные для авторизации есть, в другом нет. Балансировщик при примерно одинаковой нагрузке включает просто случайный выбор между ними. В общем, программисты иногда допускают такие косяки, что какая-то мелочь может привести к серьёзной аварии. Это я вам говорю как программист, который пишет для атомных станций :) #dev

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #releaseengineer

当前筛选 #releaseengineer清除筛选
Data Science Jobs

@datasciencejobs · Post #3122 · 02.02.2026 г., 18:18

#релизинженер#релизинженервакансия#MLOps#DevOps#ReleaseEngineer ❇️Релиз-инженер с функцией MLOps Senior ❇️| Компания Top Selection 🔥 Мы в поиске Релиз-инженера с функцией MLOps на проектную занятость Грейд: Senior Ставка: от 288К до 315К Гражданство/Локация: РФ Загрузка: фуллтайм Срок: долгосрочный Оформление: только ИП ‼️ Описание: Мы создаём интеллектуальную ML - систему прогнозирования спроса, которая учитывает сезонность, промо, макро- и микроэкономические факторы, поведение клиентов и ограничения логистики. Наш стек: GitHub/Gitlab, Jfrog Artifactory, SonarQube, Jenkins/GitlabCI , ArgoCD, Helm, Hashicorp Vault, OpenTelemetry, Grafana, Grafana Tempo, Mimir, Prometheus, Apache Spark, k8s 📝 Задачи: * Облегчение и ускорение труда разработчиков * Создание CI/CD пайпланов. * Помощь в контейнеризации приложений, подготовке к доставке и развертыванию. * Техническая консультация. * Помощь в настройке централизованной среды разработки * Управление релизным процессом, проведение, сопровождение релизов. * Заведение RFC * Проведение релизов * Контроль работоспособности систем до, во время и после релизов. * Актуализация технической документации. * Управление инфраструктурой * Поддержание работоспособности инфраструктурных сервисов. * Настройка мониторинга сервисов. * Контроль за утилизацией ресурсов, повышение оптимальности их использования. * Своевременное обновление сервисов и зависимостей. * Своевременное устранение обнаруженных уязвимостей в исходном коде и подкотрольных сервисах. ✅Требования к кандидату (+/-): - Не менее 4 лет в роли DevOps/Release Engineer или аналогичной, с фокусом на CI/CD и релизный процесс. - Опыт работы в проектах с ML-моделями. СУспешное проведение релизов в production-средах, включая управление RFC и контроль работоспособности систем до/во время/после релизов. ✅Технические навыки и обязанности: - CI/CD и релизный менеджмент: Создание и поддержка пайплайнов в Jenkins/GitLab CI; управление релизным процессом с ArgoCD и Helm; контейнеризация приложений (Docker/Kubernetes). - Инфраструктура как код: Работа с Kubernetes (k8s), HashiCorp Vault для секретов; настройка и поддержка инфраструктуры. - Мониторинг и observability: OpenTelemetry, Grafana (Tempo, Mimir), Prometheus; контроль утилизации ресурсов, выявление уязвимостей (SonarQube). - Артефакты и репозитории: GitHub/GitLab, JFrog Artifactory. - MLOps-специфика: Опыт с Apache Spark для ML-workloads; автоматизация развертывания ML-моделей, интеграция с ML-пайплайнами. - Дополнительно: Актуализация документации, технические консультации для разработчиков, настройка централизованной dev-среды, устранение уязвимостей и обновление зависимостей. ✅Стек технологий (обязательный опыт): - GitHub/GitLab, JFrog Artifactory, SonarQube, Jenkins/GitLab CI. - ArgoCD, Helm, HashiCorp Vault. - OpenTelemetry, Grafana, Grafana Tempo, Mimir, Prometheus. - Apache Spark, Kubernetes (k8s). По всем вопросам и с резюме пишите @aliiS_a