TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #983 · 11.05

Художник Gudim написал у себя в Телеграме пост о том, что главная проблема соцсетей — умные ленты. В более-менее продвинутой среде и правда принято хейтить умные ленты, включать, где возможно, хронологические, юзать альтернативные клиенты и вообще ругать корпорации за то, что они делают плохо и пользователям и авторам контента одновременно. Вездесущие умные ленты — действительно часть процесса оговнения, но дело не только в нём. Gudim сделал отсылку к классике в шутку, но на самом деле угадал: главная проблема соцсетей ровно такая же, как и главная проблема музыки — это ты. Давайте разберёмся. В теории ты подписываешься на авторов контента в соцсети, они публикуют свои посты по мере желания и готовности, посты выстраиваются в ленту, и ты от новых к старым их читаешь, подобно свежей газете или сводке новостей. Звучит хорошо до того момента, пока ты не подпишешься на условный паблик с приколами. Паблик с приколами ведут 10 человек, а сами приколы они тащат с Реддита и 9гаг, поэтому публикация занимает 5 минут. При этом от пользователей они получают охваты, которые конвертируются в деньги с рекламы. Больше охватов — больше денег. Очень быстро система приходит к тому, что им выгодно постить так часто, как они вообще способны. В идеале они хотят, чтобы вся лента каждого юзера состояла только из паблика с приколами, потому что тогда они заработают ещё больше. Вообще я лично видел рекомендации от СММщиков для пабликов ВК постить 3-5 записей в день. Каждый день. А теперь вспомните, как часто постят ваши друзья или, например, независимые авторы, которые контент не где-то берут, а создают. И вот 2-3 таких подписки, и ваша лента — неюзабельный мусор. Не обязательно паблик с приколами: спамить мотивирован вообще любой автор, потому что его доля присутствия в вашей ленте равна его заработку. Но хороший контент делается долго, на это нужно время, так что в реальности особенно удаётся спамить как раз плохому и дешёвому контенту. Как это решить: 1. "Не подписывайтесь на мусор", "Человек сам виноват, что он подписался на спам-паблик!". Да, а ещё человек совершенно добровольно решает начать курить или, скажем, принимать наркотики, но эти области всё равно в разной степени контролируются извне. Потому что авторы спам-паблика (как и наркоторговцы) ОЧЕНЬ мотивированы затянуть новых людей в свою схему заработка, и они будут использовать для этого множество разных средств, на которые неминуемо попадётся значимое число клиентов. То есть в масштабах одного конкретного человека с железной дисциплиной этот подход работает, но в масштабах системы из множества произвольных людей — нет, не работает совсем. 2. Остаётся только одно — каким-то образом фильтровать мусор. Тут возникает сразу много других проблем: начиная с того, что для разных людей понятие мусора разное, и заканчивая тем, что, да, в какой-то момент появляются ещё и интересы площадки. Площадка хочет не давать людям приятный и интересный контент, а давать людям то, что увеличивает таймспент и заработок с рекламы. И внезапно получается так, что таймспент растёт не от качества контента, кто бы мог подумать. Самые популярные в мире соцсети (Инста и Тикток) — целиком основаны на алгоритмической подаче информации. И эта информация очень "жвачкообразная" — короткая, клиповая, с быстрым захватом внимания. Так что да, если ругаете умные ленты, то просто поругайте какого-от своего друга, который пользуется Инстой, потому что именно поведение юзеров и отсутствие дисциплины у них делает такие ленты выгодными для корпораций. #web

Hashtags

Резултати

Намерени 7 подобни публикации

Търсене: #datasets

当前筛选 #datasets清除筛选
О городах и данных

@datainthecity · Post #138 · 29.12.2022 г., 09:36

47.8 миллионов километров дорог распознано в картах Bing и выложено Microsoft онлайн в виде открытых данных под лицензией ODbl [1]. В данных совсем нет Китая, Японии, Кореи, Папуа Новая-Гвинея. Но Россия есть, и обитаемая зона её не так велика как географическая. Все данные в формате TSV, сжатый объём около 10GB. Ссылки։ [1] https://github.com/microsoft/RoadDetections #opendata#datasets#microsoft

Город на карте

@geomapers · Post #564 · 07.04.2026 г., 12:34

В рубрике как это устроено у них могу сказать что для меня открытие этого года в том сколько спешно-успешно распространяются сервисы для доступа к геоданным на базе спецификации STAC (SpatioTemporal Asset Catalogs). Я как раз обновляю реестр каталогов данных Dateno и у меня сервисов поддерживающих спецификацию STAC накопилось уже 168. Скорее будет больше. При этом изначально я их классифицировал как отдельное ПО, потому что большая часть сервисов были на базе референсных реализаций, а правильнее классифицировать как протокол, а ПО определять иначе. Например, после появления расширения STAC для Geoserver (ПО с открытым кодом для создания OGC совместимых API, используется по всему миру) Особенность спецификации STAC в том что из нее сложно преобразовывать в другие спецификации и отсюда сложность в индексации в Dateno. То что обычно называют датасетом в STAC называется каталогом, в рамках этого каталога публикуются ресурсы охватывающие территорию заданную этим каталогом, но в разные промежутки времени (еженедельно, ежедневно, ежечасно и тд). В результате внутри одного набора данных могут быть тысячи и миллионы файлов. Рассматривать ресурсы как отдельные наборы данных будет некорректно, а как отображать карточки с таким числом файлов непонятно. И, кстати, перечень каталогов STAC сервисов на StacIndex неполон, у нас в реестре Dateno полнее будет, а в живой природе их сильно больше потому что, как я упоминал, он теперь поддерживается расширением GeoServer'а, а этих инсталляций в мире очень много. P.S. Кстати, у Роскосмоса тоже есть открытый STAC каталог, с декларируемыми примерно 200ТБ данными. Явление необычное при нынешнем тренде в РФ на закрытость. #opendata#geodata#datasets

Город на карте

@geomapers · Post #450 · 30.09.2025 г., 13:00

GlobalBuildingAtlas набор данных по всем зданиям в мире, общим объёмом в 36 терабайт. Опубликован в апреле 2025 г. , доступен для полной выгрузки и как сервис WFS. Под лицензией CC-BY-NC 3.0 (свободное использование для некоммерческих целей) #opendata#datasets#geodata

Город на карте

@geomapers · Post #316 · 23.04.2025 г., 06:09

Ещё одна важная находка, оказывается облачные LLM'ки вполне неплохо научились восстанавливать данные из графиков. Причём в разных формах и разных стилях. Это даёт довольно существенные возможности по превращению PDF отчетов и презентаций в таблицы с данными. Слишком многие данные вот таким образом закопаны в официальных отчётах. А теперь можно их "выковыривать" гораздо более универсальными способами. #data#datasets#llm

В рубрике интересных проектов на данныхGeoSeer [1], поисковая система по геоданным, а конкретнее по точкам API по стандартам WFS, WMC, WCS по всему миру. Я писал о нём год назад [2] и в течение года ни раз обращал внимание. Из интересного: 1. 3.5 миллиона проиндексированных георесурсов/геоданных 2. За деньги доступно API для поиска 3. Любопытная статистика по охвату [3] 4. Дают расширенное описание георесурсов с учётом его геохарактеристик (области, атрибутов WFC/WMS и др.) [4] Из особенностей: - более 60%, примерно 2 миллиона записей - это геоданные Германии. Для сравнения в Dateno 4.4 миллиона георесурсов из которых к Германии относятся 1.89, это около 43%. - реестр источников не публикуют, вернее обещают доступность только через API при платном тарифе - фасетного поиска нет, только достаточно простой язык запросов - поскольку индексируются WMS, WFC, WCS и WMTS то охватывает гораздо больше точек подключения в этих стандартах, но не охватывает все остальные геоданные, на порталах открытых данных и в каталогах ArcGIS и не только. Разницу между GeoSeer и Dateno можно описать так: 1. ✅В Dateno есть публичный реестр всех источников, он не скрывается, любой желающий может скачать его как датасет [4]. 2. ✅В Dateno есть много открытой статистики [5]. Она пока мало визуализируется, но с ней можно работать. 3. ✅В Dateno есть быстрый фасетный поиск и фильтрация по странам/территориям и другим критериям 4. ✅Dateno агрегирует геоданные из порталов неохваченных GeoSeer поскольку они не по стандартам OGC. 5. ❌Пока в Dateno нет охвата любых источников геоданным по стандартам OGC 6. ❌Пока в Dateno нет расширенного вывода метаданных для георесурсов В целом пересечение индексов GeoSeer и Dateno в части геоданных около 60-80%. GeoSeer для проекта выглядит как хороший референсный проект для проверки полноты собственной базы. Ссылки: [1] https://www.geoseer.net [2] https://t.me/begtin/5071 [3] https://www.geoseer.net/stats/ [4] https://github.com/commondataio/dataportals-registry/ [5] https://github.com/commondataio/dateno-stats #opendata#datasearch#datasets#geodata#spatial

djangoproject

@djangoproject · Post #153 · 03.09.2016 г., 20:20

http://wla.berkeley.edu/~cs61a/fa11/lectures/streams.html In this chapter, we continue our discussion of real-world applications by developing new tools to process #sequential#data. In Chapter 2, we introduced a sequence interface, implemented in Python by built-in data types such as #tuple and #list. #Sequences supported two operations: querying their length and accessing an element by index. In Chapter 3, we developed a user-defined implementations of the sequence interface, the Rlist class for representing recursive lists. These sequence types proved effective for representing and accessing a wide variety of sequential #datasets.

GitHub Trends

@githubtrending · Post #14661 · 02.05.2025 г., 11:30

#typescript#ai#analytics#datasets#dspy#evaluation#gpt#llm#llmops#low_code#observability#openai#prompt_engineering LangWatch helps you monitor, test, and improve AI applications by tracking performance, comparing different setups, and optimizing prompts automatically. It works with any AI tool or framework, keeps your data secure, and lets you collaborate with experts to fix issues quickly, making your AI more reliable and efficient. https://github.com/langwatch/langwatch