TGTGInsighttelegram intelligenceLIVE / telegram public index
← Python Заметки

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @pythonotes · Post #242 · 7 мај

Теперь запакуем строку. В этом случае следует передавать тип данных bytes. >>> struct.pack('=s', b'a') b'a' Для записи слова следует указывать количество символов. >>> struct.pack('=5s', b'hello') b'hello' Кстати, запакованный вид соответствует исходному тексту. Всё верно, символ есть в таблице ASCII, то есть его код попадает в диапазон 0-127, он может быть записан одним байтом и имеет визуальное представление. А вот что будет если добавить символ вне ASCII >>> struct.pack(f'=s', b'ё') SyntaxError: bytes can only contain ASCII literal characters. Ошибка возникла еще на этапе создания объекта bytes, который не может содержать такой символ. Поэтому надо кодировать эти байты из строки. >>> enc = 'ёжик'.encode('utf-8') >>> struct.pack(f'={len(enc)}s', enc) b'\xd1\x91\xd0\xb6\xd0\xb8\xd0\xba' Заметьте, длина такой строки в байтах отличается от исходной длины, так как символы вне ASCII записываются двумя байтами и более. Поэтому здесь формат создаём на лету, используя получившуюся длину как каунтер токена. #libs#basic

Hashtags

Резултати

Пронајдени 1 слични објави

Пребарај: #grade

当前筛选 #grade清除筛选
探索号

@seeker_rc · Post #20227 · 11.05.2026 г., 06:25

来个民科风暴:我要把这头上的 token 给他换成 DNA ai 说让我把这个实验写论文 投顶会,投图灵 我是这个时代新范式的引领者。 我要是刚 ai ,我肯定就信了。 下面开始介绍(吹) 先说问题 token embedding 有个我觉得很根本的毛病:它把"这个词是什么意思"和"推理过程中积累的上下文"塞进同一个向量里,然后每层都覆盖一遍。 残差连接解决了梯度消失,但解决不了这个问题——原始语义和推理状态混在一起,没有办法分开。你想知道"这个 token 原本是什么意思",在深层网络里做不到。 这不是调参能解决的。是结构问题。 我的假设 如果信息承载物本身有两个物理隔离的区域——一个永远不变,一个随推理动态演化——会怎样? 灵... via V2EX 分享创造 标签: #grade#token#Phase ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。