TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #884 · 5.10

Роскосмос пару дней назад опубликовал отчёт о том, почему упала "Луна-25". Там конечно канцелярит, но можно примерно понять, что двигатель коррекции получил неверные данные от акселерометра: из-за возможного попадания в один массив данных команд с различными приоритетами их исполнения прибором Это очень похоже на программную ошибку, а это моя сфера, и я решил над ситуацией поразмыслить. Хейтеры сразу стали строчить комментарии в стиле "Ололо, наняли каких-то идиотов, которые простейшие тесты не провели". Тут обычно справедливо вспоминают аварию с европейской ракетой Ариан-5 в 1996 году. Там буквально из-за пары строчек кода в результате неправильного приведения числовых типов ракета за 7 млрд баксов развалилась на куски в воздухе. Бывает. Что касается Роскосмоса, при всей его сомнительной репутации, объяснение "Дураки не провели тесты" звучит лично для меня неправдоподобно. На мой личный взгляд возможны два варианта: 1. Если в описании ошибки слово "приоритет" обозначает какой-то признак внутри объекта команды, значит, на входе в приёмный модуль эти команды не были отфильтрованы. Выглядит как грубая ошибка, целый логический блок упущен. Вряд ли этот блок вообще не написан, скорее всего он не выполнился. Такое бывает, если в тестовой среде есть какое-то условие, которого нет в рабочей, и именно это условие отвечает за выполнение участка кода. Сталкивался с таким миллион раз. Самое дикое из последнего: код парсит эксель-таблицу с числами. Разработчик написал, запустил проверил, прогнал тесты, всё ок. Отправляем в прод — все числа будто бы рандомно меняются на другие. Запускаем снова — у всех разработчиков функционирует нормально, а в проде на сервере нет. Таблица одна и та же. Можете подумать, почему так. Ответ: у разработчиков стоит русская локаль и десятичный разделитесь это запятая, а на проде в докере точка. При парсинге на проде запятая уже интерпретируется как разделитель тысячных разрядов. 2. Куда вероятнее, что слово "приоритет" в описании ошибки обозначает время, а, значит, список команд просто не был отсортирован, и в обработчик уже после актуальных значений попали какие-нибудь начальные нулевые данные, сбившие логику. По косвенному описанию проблемы очень похоже именно на это. Значит, на тестах всегда порядок возникновения команд соответствовал порядку их прихода, а в реальности перестал соответствовать. Вообще, работать с железом очень сложно. Какую-нибудь схемку заглючило от холода, она задержала ответ от датчика на миллисекунду, и всё. Никто не знал, что такая проблема возможна, пока она не возникла. Мне рассказывали о таком случае: юзер логинится на сайт и иногда логин проходит, а иногда нет. Логин и пароль те же самые. Просто в случайные моменты времени ему возвращают токен авторизации, а в другие моменты времени ошибку 403. Никакой закономерности нет вообще. Нет зависимости от времени суток и даты. Сервер точно работает стабильно и не падает все 100% времени. Почему так может быть? Ответ: у сервиса авторизации два инстанса, перед которыми балансировщик нагрузки. В одном инстансе данные для авторизации есть, в другом нет. Балансировщик при примерно одинаковой нагрузке включает просто случайный выбор между ними. В общем, программисты иногда допускают такие косяки, что какая-то мелочь может привести к серьёзной аварии. Это я вам говорю как программист, который пишет для атомных станций :) #dev

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #copy

当前筛选 #copy清除筛选

#Maintenance#copy 尊敬的客戶您好, Dear Valued Customer, 您收到此郵件是因為我們將對 LAX 區域服務器 進行下電維護,您的服務將會受到影響。 You are receiving this email because we will be performing a power-down maintenance on the LAX region servers, which will affect your services. 我們將於 香港時間 2025年9月14日 下午2點至下午4點 期間進行維護,約需 10分鐘的斷電升級操作。 The maintenance will take place on September 14, 2025, from 2:00 PM to 4:00 PM HKT, requiring approximately 10 minutes of downtime for upgrades. 對應的 洛杉磯當地時間為 2025年9月13日 晚上11點至 2025年9月14日 凌晨1點。 This corresponds to Los Angeles local time: September 13, 2025, 11:00 PM to September 14, 2025, 1:00 AM. 在此期間,您的服務將不可訪問,請提前做好業務備份與冗餘切換的準備。 During this time, your services will be unavailable. Please ensure proper backups and redundancy measures are in place. 我們對因此帶來的不便深感抱歉,並將在 Telegram 公告頻道 (https://t.me/backwaves) 中跟進維護進展。 We sincerely apologize for the inconvenience and will provide updates on the Telegram channel (https://t.me/backwaves). 郵件將不再另行通知,維護結束後,您的服務器會自動重新啟動。 No further email notification will be sent. After the maintenance, your server will automatically reboot. 如果您在維護結束後遇到任何問題,歡迎隨時通過網站工單聯繫我們,我們將盡快回覆並協助處理。 If you experience any issues after the maintenance, please feel free to contact us via support ticket on our website, and we will respond promptly. 感謝您的理解與支持。 Thank you for your understanding and continued support. Website: BackWaves.net Channel: @BackWaves Group: @BackWavesIdc