Теперь запакуем строку.
В этом случае следует передавать тип данных bytes.
>>> struct.pack('=s', b'a')
b'a'
Для записи слова следует указывать количество символов.
>>> struct.pack('=5s', b'hello')
b'hello'
Кстати, запакованный вид соответствует исходному тексту. Всё верно, символ есть в таблице ASCII, то есть его код попадает в диапазон 0-127, он может быть записан одним байтом и имеет визуальное представление. А вот что будет если добавить символ вне ASCII
>>> struct.pack(f'=s', b'ё')
SyntaxError: bytes can only contain ASCII literal characters.
Ошибка возникла еще на этапе создания объекта bytes, который не может содержать такой символ. Поэтому надо кодировать эти байты из строки.
>>> enc = 'ёжик'.encode('utf-8')
>>> struct.pack(f'={len(enc)}s', enc)
b'\xd1\x91\xd0\xb6\xd0\xb8\xd0\xba'
Заметьте, длина такой строки в байтах отличается от исходной длины, так как символы вне ASCII записываются двумя байтами и более. Поэтому здесь формат создаём на лету, используя получившуюся длину как каунтер токена.
#libs#basic
🇨🇳 DeepSeek V4 выходит на этой неделе //
1 триллион параметров, активных при генерации — всего 32 млрд (MoE). Работает локально на двух RTX 4090. Контекст — 1 млн токенов против 128K у V3, точность 97%. Скорость генерации выше в 1.8 раза.
Главный фокус на код. Плюс мультимодальность — текст, картинки, возможно видео.
Оптимизирован под чипы Huawei и Cambricon. Без приоритета для Nvidia. По слухам, DeepSeek готовит конкурента Cursor для китайского рынка.
Официального релиза еще нет, но возможно сегодня анонсируют.
🧠Следи за AItoolz — следим за релизом
#DeepSeek#DeepSeekV4#релиз