TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #310 · 21.04

Поймал себя на том, что иногда мне нравится ездить на автомобиле, а иногда нет. Понятно, что чилить на автостраде это прикольно, а пробиваться через городские пробки — нет. Но я осознал, что иногда мне в городе вполне прикольно, а иногда нет. Я даже в пробках иногда стою спокойно. Начал рефлексировать, и понял: мне приятно ездить, когда я никуда не тороплюсь. Когда можно опоздать на 5-10-15 минут, а то и на полчаса. В гости к друзьям обычно можно опоздать. В магазин можно опоздать, если ты не под закрытие едешь. А вот если едешь на какое-то мероприятие ко времени, то опаздывать нельзя, и обычно даже 10 минут неприятны. Дорожная ситуация меняется не слишком предсказуемо. Время на поиск места парковки тоже не определено. Да и постоянное искушение где-то что-то нарушить, чтобы не опоздать. Либо наоборот — выезжаешь на машине сильно заранее, и на месте просто ждёшь полчаса. В общем, машина хорошо решает задачу "Добраться куда-то в место, плохо доступное другими видами транспорта". Но не слишком хорошо решает задачу "Добраться куда-то к заданному моменту с точностью плюс-минус 5 минут". А, например, пешком + метро решает хорошо. Можно, конечно, пофантазировать на тему какого-то предсказания и правильного планирования, но на деле пара забитых перекрёстков вполне могут стоить вам 10 минут, что в контексте городской жизни довольно много. P.S. Скоро у меня отпуск, и будут очень интересные посты про дроны и мототехнику. Хотя погода в Питере как обычно норовит подвести в самое неподходящее время. С таким климатом хоть на автомобиле езди! #life

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #grade

当前筛选 #grade清除筛选
探索号

@seeker_rc · Post #20227 · 11.05.2026 г., 06:25

来个民科风暴:我要把这头上的 token 给他换成 DNA ai 说让我把这个实验写论文 投顶会,投图灵 我是这个时代新范式的引领者。 我要是刚 ai ,我肯定就信了。 下面开始介绍(吹) 先说问题 token embedding 有个我觉得很根本的毛病:它把"这个词是什么意思"和"推理过程中积累的上下文"塞进同一个向量里,然后每层都覆盖一遍。 残差连接解决了梯度消失,但解决不了这个问题——原始语义和推理状态混在一起,没有办法分开。你想知道"这个 token 原本是什么意思",在深层网络里做不到。 这不是调参能解决的。是结构问题。 我的假设 如果信息承载物本身有两个物理隔离的区域——一个永远不变,一个随推理动态演化——会怎样? 灵... via V2EX 分享创造 标签: #grade#token#Phase ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。