Я всегда был уверен, что системы рекомендаций работают так плохо, потому что это слишком сложная задача. Владельцы площадок бьются с алгоритмами, машинным обучением, деревьями решений и взвешенными суммами, но получается всё равно херня, и человеку могут рекомендовать нерелевантный бред (и, что ещё хуже — не рекомендовать интересный для него контент).
Кажется, хорошо работают только рекомендации на Ютубе, но этому есть объяснение: контент на Ютубе более длительный и дорогой. Его сложнее производить, он выходит реже. Качественный ролик на Ютубе не будет говном практически независимо от темы, на которую он снят. А ещё меньшее число объёмных роликов проще кластеризовать и можно предлагать пользователю в небольших количествах.
Но если мы откроем YouTube Shorts (это очередной аналог тиктока с короткими вертикальными видео), то заметим, что качество рекомендаций упало сразу на два порядка: какие-то тупые попсовые шутки, "удивительные" факты из жизни, завлекающие отрывки из фильмов "код смотри в телеграм-канале", озвучка анекдотов и прочий мусор. Алгоритмы уже совсем не справляются с тем, чтобы предложить что-то годное, не говоря уже о релевантности конкретно мне, хотя история моих просмотров и вкусов Ютубу, очевидно, известна.
Тем не менее, иногда разработчики могут не только не уметь, но и не хотеть писать нормальные рекомендации. Вот ВК предложил мне BadComedian в блоке "Интересные авторы". Оставим в стороне, что Бэдкомендиан это ютубер, и у него в ВК в лучшем случае будут репосты ссылок на Ютуб. Но мне предлагают не паблик, а личную страницу.... на которой не было записей с сентября 2021 года. Нет совершенно никакого смысла быть подписанным на личную страницу Бэдкомедиана сейчас. Кажется, единственный критерий, на котором основывались эти рекомендации: общее число подписчиков.
Как должны работать рекомендации на самом деле? Алгоритмически я бы оценивал частоту постов (кстати, чрезмерно частые это тоже плохо, должно работать в минус), оценивал бы, является пост просто публикацией внешней ссылки на другой ресурс, является ли репостом паблика, и смотрел бы, сколько прошло времени с последней записи на странице автора. Наверное, в качестве коэффициента с небольшим весом можно добавить ещё объём контента в посте и активность людей (лайки + комментарии). Причём, делается это достаточно просто, никакой ML не нужен. Даже такая оценка, не берущая в расчёт тематику страницы, всё равно лучше, чем "Просто покажем людей, на которых когда-то подписалось куча народу, и им до сих пор лень отписаться после прекращения активности автора".
По крайней мере теперь меня не удивляет, что хвалёные Клипы постоянно подсовывают мне какой-то подростковый шлак вместо крутых видео с полётами на FPV-квадрокоптерах. YouTube Shorts по крайней мере пару раз такие вещи предлагал, а вот Клипы вообще ни разу (станицу Клипов я не открываю, разумеется, но в ленте новостей встречаются блоки с автовоспроизведением).
Кстати, на скрине есть второй автор — Стас "Ай как просто". Его банят на Ютубе за критику западной модели текущих событий, и он пишет: "Буду создавать каналы-однодневки, куда деваться". То есть у него даже мысли не возникает, что какая-то ещё площадка может служить его целям. Ну с таким отношением других площадок к рекомендациям — понятно.
#web
А вот топы публикаций на Хабре за год, например.
Рейтинг
В топе по рейтингу характерно в основном UGC, и там либо очень болезненные нетехнические темы (моя про собесы, ниже про ИИ и ненормальность), либо очень интересно написанные технические.
Прикольно, что топ-2 статья про 2ГИС, где я теперь работаю, и этим событием заканчивается моя статья выше про собесы. Можно читать сверху вниз, сквозной сюжет. Но про 2ГИС не моя, была ещё раньше: статья о фейковых отзывах, очень годная, вроде как наши сразу взяли в работу, как она появилась.
И не могу не заметить топ-6 статью, где автор рассказывает, как его задолбала ИИ-истерия везде, и в айти особенно.
Просмотры
В топе по просмотрам хайповая фигня, куда либо компании льют траффик (ИИ), либо просто приходят залётные юзеры из поиска (про вотсап). Там вообще почти весь топ это вотсап и макс, скукота.
Комментарии
Ожидаемо политота и холиварные топики. Полит-срачи вообще очень затягивающая штука, я попадаю в них чаще, чем хотелось бы, к сожалению. И я прям иногда по рукам себя бью, чтобы не писать политически окрашенные посты в этот блог, даже если тема кажется мне прям супер однозначной и не допускающей никакой дискуссии.
В целом на Хабр оказывается написали 50к материалов за год (новости + статьи). Многие дублируют туда свои личные телеграм-каналы или вообще постят любой медиа-мусор пачками. Но даже с учётом этого 50к это прям очень много.
#web@clockstackwheels
Уже у нескольких людей в кругу общения такое (включая меня), причём не случайность, а именно вот в эти дни внезапно стал глючить вход в другие сервисы через ГУ, и уходит в блокировку. Либо прям серьёзный баг на прод выкатили, либо специально. Хотя по бритве Хэнлона всё-таки первое. #web
Ставьте 😭 если и у вас так. Кажется ситуация относительно массовая.
UPD. Да, массовая: https://habr.com/ru/news/977892/
Последние месяцы у меня прямо заметное количество человек в Телеграме стали постить сторисы, хотя раньше эти люди обитали в публичном поле исключительно в Инсте.
Сторисы, конечно, ужасный формат, и их существование — великое горе для человечества. Но вот появление Инстаграм-инфицированных людей в публичном пространстве Телеги это хороший признак — Инста, по-видимому, перестаёт давать нужный отклик аудитории в России. Возможно, ещё не всё потеряно.
Что касается остальных блокировок, то наконец-то родительские чатики, сообщества домов и общение с арендодателями квартиры вылезут из Вотсапа (хотя у меня удалён уже много лет). Природа очистится.
Ну и хочу прокомментировать новый закон из Австралии, где запретили соцсети подросткам до 16 лет. Давайте так: соцсети это современный цифровой алкоголь. Его можно уметь употреблять в меру, абсолютное большинство людей так и делает. А детям мы запрещаем его, потому что более менее сошлись в оценке их способности к самоконтролю и взвешенным ответственным решениям. То есть направление мысли понятно, и оно даже отзывается во мне. Хотя я бы может поставил 14 лет.
Но совершенно непонятно:
1. Как вообще технически реализовать выполнение этого закона, если устанавливать VPN современные дети учатся раньше, чем читать?
2. Что мешает получать всё то же самое из источников, формально не являющихся соцсетями? Например, в групповых чатиках в мессенджерах (в том числе в официальных школьных мессенджерах, допустим).
#web@clockstackwheels
Сегодня закрыли Skype после 22 лет работы, ушла эпоха.
Когда-то мне приходила в голову такая мысль: если подростком вы пошли в кино на фильм с взрослыми известными актёрами, то вероятнее всего в какой-то момент прочитаете новость о смерти каждого из них.
Вот и с сервисами — нашему поколению суждено читать новости о смерти того, чем мы пользовались в школе, университете, в более молодые годы. Я вот застал смерть Flash, ICQ (и QIP), ATI (видеокарты), мобильных веток Nokia и Siemens, Башорга и Лурка, НародРу, SonyEricsson, Motorola, WinAmp. Есть вещи, которые номинально существуют, но в любом значимом смысле из практического поля вышли: ЖЖ, Rambler, FlyBoard...
Интересно, что десктопный софт, похоже, крепче, чем интернет-сервисы. Помню в школе начинал изучать 3D max, тогда ещё принадлежавший фирме Discreet, и вот он до сих пор живее всех живых, правда уже под эгидой Autodesk. Даже Blender его не убил, что не перестаёт меня удивлять.
Или MS Office — всех нас переживёт, похоже. Microsoft в своё время сделали превосходную ставку, догадавшись оцифровать самую базовую офисную рутину. В 2025 году у нас везде ИИ и SPA с формами, но в бухгалтерию ты всё равно кидаешь docx-файл со вставленным сканом собственной подписи.
Погуглил: даже Dreamweaver существует и обновляется, помните такой? Для меня он всегда будет продуктом Macromedia. Да, я был там, Гэндальф, 3000 лет назад.
А эти ваши интернет-сервисы мрут, как мухи. Текстам в интернете каюк (и тексто-ориентированным соцсетям, как следствие). Фотки ещё держатся, но уже в основном на телефонах: никто не переживает от отсутствия вменяемой версии Инсты для десктопа. Видео... уверен, мы застанем ещё убийство Ютуба короткими вертикальными роликами. Возможно сайт по домену «Ютуб» будет открываться, но не такой, как сейчас. А дальше, думаю, когда смартфоны научатся посылать бессодержательный электрический импульс прямо в центр удовольствия, тогда уже и короткие видео пропадут.
Сколько из того, чем я пользуюсь сейчас каждый день, сохранится через 10, 20 лет? 50? Вот и посмотрим. Skype RIP, о тебе только хорошие воспоминания, хоть и недолгие.
#web
Авито конечно удивительный пример оторванности компании от реального поведения своих юзеров. Наверное, не слишком необычно, что богатые топ-менеджеры, принимающие решения в компании такого размера, сами не занимаются продажей и покупкой с рук, но уж для проформы то заглянуть разок могли бы в собственную экосистему.
Например: Авито ввёл комиссию для покупки с доставкой, и заявляет, что эта комиссия списывается с продавца. Но доставка нужна покупателю, а не продавцу. Продавцу даже менее удобно носить вещь куда-то, вместо того, чтобы ждать, когда к нему заедут. В итоге 99% продавцов при заказе с доставкой готовы продать только дороже на процент комиссии. И хорошо, если они пишут об этом заранее в тексте описания, а не в личку после того, как ты уже оплатил товар по изначальной цене. В итоге приходится заказ отменять и перезаказывать.
Или вот: Авито предлагает на выбор разные формы доставки, но продавцы отдельно ещё сами не готовы носить товар в какой-то далёкий для них пункт, поэтому иногда пишут, что, дескать, выбранный вами способ доставки не поддерживаем, выберите другой. Интерфейс опять же не даёт для этого никаких предварительных функций, приходится отменять.
В целом Авито правильно делает, пытаясь уменьшить необходимость контакта с людьми. В идеале я при покупке хочу как на маркетплейсах, а при продаже чтобы ко мне приезжал курьер и забирал. Без обсуждения, без торга, без попыток договориться итд.
Но реальные люди действуют так, чтобы минимизировать ущерб и объём возни для себя, и это нормально. И понятно всем, кроме руководства Авито.
#web