Recent posts
Page 8 of 68 · 812 posts
Posted Mar 19
Posted Mar 19
Posted Mar 17
Posted Mar 16
Posted Mar 16
Kimi становится DeepSeek 2. Самая обсуждаемая работа сегодня - Moonshot AI, разработчики Kimi, выпустили свежую работу Attention Residuals В обычных нейросетях каждый слой просто прибавляет своё к предыдущему Всегда одинаково, вслепую Attention Residuals предлагает другое - пусть сеть сама выбирает, что взять из предыдущих слоёв и в разных пропорциях для разных входных данных Грубо говоря, они применили механизм attention не по горизонтали (между токенами), а по вертикали (между слоями) Что это даёт на практике: 1. та же точность модели при в 1.25 раза меньших вычислениях 2. замедление инференса менее чем на 2 % 3. лучшая стабильность обучения Работает как замена без переделки архитектуры Проверено на их собственной модели Kimi Linear (48B параметров) Moonshot не гонятся за параметрами, они выжимают больше из той же архитектуры
Posted Mar 16
Posted Mar 15
Короткая, но полезная статья, в которой собраны необычные и малоизвестные трюки с перенаправлениями в bash - /dev/tcp - Placeholder - - Группировка команд - Подмена процессов https://habr.com/ru/post/786224/
Posted Mar 15
В комментариях часто просят рассказать общую картину линейной алгебры (Big Picture of Linear Algebra) Рассказываю: В линейной алгебре существует четыре фундаментальных подпространства матрицы размера 𝑚×𝑛, которые помогают понять структуру матрицы и её свойства Эти подпространства представлены на схеме Гилберта Стрэнга и играют ключевую роль в анализе линейных систем: Пространство строк (Row space) — это множество всех линейных комбинаций строк матрицы 𝐴 Размерность: 𝑟 (ранг матрицы) Пространство столбцов (Column space) — множество всех линейных комбинаций столбцов матрицы 𝐴 Размерность: 𝑟 (ранг матрицы) Нулевое пространство (Null space) — множество всех решений уравнения 𝐴𝑥=0 Размерность: 𝑛−𝑟 Нулевое пространство транспонированной матрицы (Null space of 𝐴^T ) — множество всех решений уравнения 𝐴^𝑇𝑦=0 Размерность: 𝑚−𝑟 Смысл схемы (The Big Picture) заключается в наглядном отображении связи между четырьмя фундаментальными подпространствами матрицы Она показывает, как пространство строк и нулевое пространство матрицы 𝐴 живут в одном пространстве а пространство столбцов и нулевое пространство транспонированной матрицы — в другом Ортогональность этих подпространств подчёркивает, как решения уравнений 𝐴𝑥=0 и 𝐴^𝑇𝑦=0 связаны с рангом матрицы и её структурой Надеюсь закрыл это вопрос
Posted Mar 14
Для будущих отказоустойчивых систем предназначен алгоритм квантовой оценки фазы (QPE) Однако здесь возникает проблема «ортогональной катастрофы»: с увеличением размера молекул вероятность вычисления их минимального энергетического уровня падает экспоненциально Таким образом, даже с идеальными квантовыми компьютерами найдется лишь небольшое число случаев, где QPE будет оптимальным выбором Способность запускать QPE стоит рассматривать скорее как показатель зрелости технологии, а не как повседневный инструмент для химиков Исследование ставит под сомнение, является ли квантовая химия «золотой жилой» для квантовых компьютеров, хотя существуют и другие способы их применения, например, моделирование химических систем после лазерного облучения
Posted Mar 14
Борис Самуилович Бокштейн (24.07.1935–11.03.2026) Атомы блуждают по кристаллу (Библиотечка «Квант», вып. 28) https://math.ru/lib/bmkvant/28
Posted Mar 12
Обновление которое добавит поддержку mesh-сети на базе Bluetooth и Wi-Fi Direct позволит Telegram полностью пережить любые блокировки, включая тотальное отключение интернета в отдельной стране Принцип крайне простой и революционный: устройства пользователей начинают напрямую общаться между собой, образуя самоорганизующуюся сеть Если хотя бы одно устройство в этой сети имеет доступ к интернету (через спутник, иностранную SIM-карту, VPN или просто потому что находится за границей), то сообщения, файлы, сообщения, звонки и обновления будут передаваться по цепочке до всех участников Чем больше пользователей — тем устойчивее сеть Даже в полностью изолированной стране Telegram продолжит работать как локальная сеть обмена сообщениями, пока хотя бы одно устройство не получит внешнюю связь Технология уже реализована в BitChat BitChat работает полностью оффлайн: сообщения передаются по Bluetooth и Wi-Fi между устройствами в радиусе 100–200 метров, а при движении людей сеть автоматически расширяется и сжимается Такая сеть практически неуязвима Её нельзя заблокировать на уровне провайдера, DPI или серверов — серверы вообще не нужны Нельзя запретить Bluetooth и Wi-Fi — это элемент абсолютно всех современных устройств Нельзя отследить всех пользователей — их миллионы, и сеть децентрализована Даже массовые изъятия мобильных телефонов не помогут: достаточно нескольких десятков устройств в каждом районе, чтобы связь сохранялась Если Telegram создаст mesh-сеть, РКН потеряет главный рычаг давления на Telegram Власти либо смиряются с существованием свободного мессенджера, либо идут на крайние меры, которые парализуют всю страну Пока это только прогноз экспертов, но технически всё готово BitChat уже доказал работоспособность и полную независимость от наличия интернета У Telegram самая большая потенциальная mesh-сеть в истории человечества Одно обновление — и проблема блокировок решена навсегда
Posted Mar 12
Alibaba протестировала 18 агентов для программирования — 100 настоящих кодовых баз, каждая — 233 дня разработки Задача — не просто написать код, а поддерживать его в течение 8 месяцев И тут всё развалилось. Написать код, который один раз проходит тесты — можно Поддерживать код и не ломать его при каждом изменении — почти никто из моделей не смог Для этого Alibaba сделала новый бенчмарк — SWE-CI Он проверяет не "почини баг один раз", а как код переживает эволюцию проекта Каждая задача — это 71 последовательный коммит реального развития кода Результаты: - 75% моделей ломают ранее работающий код во время поддержки - только Claude Opus 4.5 и 4.6 держатся выше 50 % zero-regression rate - остальные модели накапливают технический долг на каждой итерации Вывод: Почти все модели умеют писать код Почти ни одна не умеет его поддерживать Как живые программисты