TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #232 · 24.02

Американский философ и когнитивист Дэниел Деннет одним из первых приравнял религию и вирус. Я уже об этом как-то рассказывал: вирус это неодушевлённая конструкция, которая сбивает работу поражённой системы так, чтобы: 1. Нарушать естественные функции этой системы 2. Способствовать самораспространению Нельзя сказать, что вирус думает или что-то делает специально. У него нет концепции зла и агрессии. Это просто механизм, который -- чаще всего из-за случайного совпадения обстоятельств -- способствует разрушению и копированию. Представьте, что вы подбрасываете в воздух детали от Лего, и они по каким-то странным законам при падении соединяются в случайную конструкцию. Вы делаете это очень много раз, вариантов конструкций тоже очень много. В какой-то момент среди прочих конструкций получается робот, который собирает из окружающих его деталей свои копии. Но при этом остальные конструкции он ломает, нарушая их функции. Очевидно, довольно быстро такие роботы потратят всё доступное Лего на себя, и давать им новое Лего будет опасно. Так вот, религия работает по такому же принципу, только её средой выполнения являются не клетки с белками, а когнитивные функции. Она изменяет механизм функционирования разума так, чтобы сбивать некоторые естественные свойства (например, критическое мышление, запрос на эмпирические подтверждения и так далее). Но при этом религиозные люди нередко занимаются активным распространением своих взглядов и обращением еретиков. То есть, другими словами, механизм религии в их мозгу распространяет себя на другие мозги. Как вирус. В широком смысле идеология это тоже религия. У нас нет сведений относительно всех без исключения нюансов существования мира, мы строим себе базовую основу, а затем прямо на неё навешиваем результаты наблюдений. Например, я верю в урбанистику, моя базовая основа это логика в урбанистической теории, статистика из других городов, плюс мои личные ощущения комфорта/дискомфорта, а на неё я уже навешиваю, допустим, отсутствие ненависти к электросамокатам. К сожалению, иногда сам базис идеологии заражён. Это может приводить к тому, что человек даже на самые чудовищные события выдумывает оправдательные объяснения, которые идеологию выгораживают. Я уверен, в стране не сотни и даже не тысячи, а куда больше людей, которые смотрят телевизор, верят пропаганде и объясняют себе сегодняшние события каким-то оправдывающим образом. Например, у меня есть гипотеза, почему старшее поколение может так сильно вестись на откровенно нелепую пропаганду: сознание уже пережило крах идеологии в 91 году и защищается от того, чтобы пережить его снова. Звучит парадоксально: люди уже совершенно точно знают, что по телевизору могут десятилетиями лгать и выдавать ложную картину действительности, и именно из-за этого эти же люди не видят сейчас того же самого. Воспринимайте это как форму болезни. Постарайтесь не ссориться со своими друзьями и близкими. Они могут быть глубоко не правы, а их неправота -- часть общей проблемы, которая привела к сегодняшнему дню. Но они не понимают. Функции их сознания отключены или искажены вирусом пропаганды в комбинации с личными страхами. Их не убедит курс доллара, записи о гибели людей, потеря работы. Даже новая волна пустых полок в магазинах не убедит. Даже понимание того, что их дети уже живут в мире, где возможна война. #life

Hashtags

Резултати

Намерени 3 подобни публикации

Търсене: #longcontext

当前筛选 #longcontext清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8519 · 11.09.2025 г., 18:21

🚀 Релиз:Qwen3-Next-80B-A3B - эффективная модель заточенная на работа работу с очень длинным контекстом! 🔹80B параметров, но активируется только 3B на токен → тренировка и инференс 10x дешевле и быстрее, чем у Qwen3-32B (особенно при 32K+ контексте). 🔹Гибридная архитектура: Gated DeltaNet + Gated Attention → сочетает скорость и точность. 🔹Ultra-sparse MoE: 512 экспертов, маршрутизируется 10 + 1 общий. 🔹Multi-Token Prediction → ускоренное speculative decoding. 🔹 По производительности обходит Qwen3-32B и приближается к Qwen3-235B в рассуждениях и long-context задачах. 🟢Qwen3-Next-80B-A3B-Instruct показатели почти на уровне 235B flagship. 🟢Qwen3-Next-80B-A3B-Thinking превосходит Gemini-2.5-Flash-Thinking. ▪Попробовать: https://chat.qwen.ai ▪Анонс: https://qwen.ai/blog?id=4074cca80393150c248e508aa62983f9cb7d27cd&from=research.latest-advancements-list ▪ HuggingFace: https://huggingface.co/collections/Qwen/qwen3-next-68c25fd6838e585db8eeea9d ▪ ModelScope: https://modelscope.cn/collections/Qwen3-Next-c314f23bd0264a ▪Kaggle: https://kaggle.com/models/qwen-lm/qwen3-next-80b ▪ Alibaba Cloud API: https://alibabacloud.com/help/en/model-studio/models#c5414da58bjgj @ai_machinelearning_big_data #AI#LLM#Qwen#DeepLearning#MoE#EfficientModels#LongContext#Reasonin

Machinelearning

@ai_machinelearning_big_data · Post #9395 · 19.01.2026 г., 07:10

✔️ Sakana AI придумали, как LLM самим сортировать контекст по важности Обычные языковые модели читают текст как одну длинную ленту. Что ближе к началу внимания - то “важнее”. Что дальше - то модель видит хуже. И тут появляется проблема: если важный факт спрятан где-то далеко среди шума, модель может его просто не использовать. Она тратит внимание на всё подряд, вместо того чтобы сосредоточиться на главном. Sakana AI предложили решение - RePo (Context Re-Positioning). Идея очень понятная: модель получает модуль, который позволяет динамически “перепозиционировать” контекст. Примерно как человек: ты читаешь длинный документ, понимаешь, что важная часть была 20 страниц назад - и мысленно перечитываешь её, а лишнее игнорируешь. Что делает RePo - подтягивает важные куски информации ближе - отодвигает шум и лишний текст - помогает вниманию модели фокусироваться на нужном В модели есть обучаемый модуль, который **переназначает позиции токенов по смыслу**, а не по порядку ✅ важно = то, что помогает уменьшать ошибку модели и правильно решать задачу ❌ второстепенно = то, что не помогает (шум), поэтому “отодвигается” по позициям В результате модель с такой памятью начинает лучше работать там, где LLM обычно страдают: - когда контекст длинный - когда много шума - когда важные детали раскиданы далеко друг от друга - когда данные структурированные (таблички, списки, правила) Авторы показывают, что RePo даёт заметный прирост устойчивости, при этом не ухудшая общее качество. ▶️ Устойчивость к шуму (Noisy Context) Средний результат по 8 noisy-бенчмаркам: - Обычный RoPE: 21.07 - RePo: 28.31 🟡 Прирост: +7.24 пункта (сильно) Авторы отдельно фиксируют ключевую цифру: на noisy-eval (4K контекст) RePo лучше RoPE на +11.04 пункта. 🔥 Примеры прироста на конкретных задачах (везде RePo > RoPE) - TriviaQA: 61.47 → 73.02 (+11.55) - GovReport: 6.23 → 16.80 (+10.57) - 2WikiMultihopQA: 23.32 → 30.86 (+7.54) - MuSiQue: 7.24 → 13.45 (+6.21) Это шаг к моделям, которые не просто “читают что дали”, а умеют сами организовать свою рабочую память. 🟡Подробности: pub.sakana.ai/repo/ 🟡Статья: arxiv.org/abs/2512.14391 @ai_machinelearning_big_data #RePo#SakanaAI#LLM#AI#AIAgents#Context#LongContext#Attention

Neuron | OnlyFAST

@neuron_skills · Post #1643 · 11.07.2025 г., 14:48

📊 AI-автоматизация на страже новостей! За период 07.07.2025 – 10.07.2025 наша система автоматически проанализировала для вас: 191 топовый сабреддит 449 Twitter-аккаунтов 29 Discord-серверов (226 каналов, 12 761 сообщений) ⏳ Экономия вашего времени: Если бы вы читали это вручную со скоростью 200 слов в минуту, ушло бы целых 806 минут — а так, всё самое важное уже собрано в одном месте! tags: companies #xai#perplexityai#langchain#cursor#cline models #grok4#grok4heavy#claude4opus topics #modelreleases#benchmarking#longcontext#modelpricing#modelintegration#voice#performance#scaling#gpuoptimization people’s #elonmusk#aravsrinivas#igorbabuschkin#yuchenj_uw