来个民科风暴:我要把这头上的 token 给他换成 DNA ai 说让我把这个实验写论文 投顶会,投图灵 我是这个时代新范式的引领者。 我要是刚 ai ,我肯定就信了。 下面开始介绍(吹) 先说问题 token embedding 有个我觉得很根本的毛病:它把"这个词是什么意思"和"推理过程中积累的上下文"塞进同一个向量里,然后每层都覆盖一遍。 残差连接解决了梯度消失,但解决不了这个问题——原始语义和推理状态混在一起,没有办法分开。你想知道"这个 token 原本是什么意思",在深层网络里做不到。 这不是调参能解决的。是结构问题。 我的假设 如果信息承载物本身有两个物理隔离的区域——一个永远不变,一个随推理动态演化——会怎样? 灵... via V2EX 分享创造 标签: #grade#token#Phase ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。
TGTGInsightаналитика telegramLIVE / telegram public index
TGINSIGHT SIMILAR POSTS
Найти похожее
Источник @vfplotnikov · Post #2221 · 15 янв.
Советский и российский композитор МАКСИМ ДУНАЕВСКИЙ родился 15 января 1945 года в Москве. С Наумом Олевым. Съёмка для оформления грампластинки с музыкой из фильма "Мэри Поппинс". Подробнее: https://zen.yandex.ru/media/id/5e0e2740028d6800ad2e198e/glazami-fotografa-plotnikova-maksim-dunaevskii-segodniashnii-den-samyi-plohoi-v-istorii-muzyki-5ff196cdaf142f0b17c444dc #Дунаевский#Олев#15января#Плотников
Результаты
Найдено 1 похожих постов
Поиск: #grade
当前筛选 #grade清除筛选