Find similar content

Source channel @olddriverGDstudy · Post #102 · Oct 18

游龙历险记孔子云:食色性也。本人自然逃不出圣人所料。于是踏上了这条不归路。能看到这篇文章的估计都已经在此道初窥门径，我便不再规劝各位，望各位好自为之。以下我分享一下个人探索世界的经历，希望各位能从其中吸取教训，少上当，多开好车。探索篇人生初体验：资源途径是朋友分享的专业招嫖软件，名为51品茶。一日恰逢休假，兴致大发，遂行动。QQ约好800/pp（上门）。到了宾馆之后给她拍房卡，发送手机号，坐等上门。约半小时后，人到。人图不一，想退货，奈何是个新手在小姐的忽悠下同意了（这个小姐外形也还行）。付钱开搞。服务非常简单，口硬了开干。态度奇差，一直玩手机。一炮结束后，大为扫兴，要求退钱。小姐没同意，说给推荐其他资源。让人走了，发消息不回。两百块没了。事后反省：招嫖软件上的基本都是代聊，鸡头，层层转包，八百最后到小姐手机可能只有四百。尽量不要通过软件找。根据另一次经历，推测出一个人软件发布资源，然后转给鸡头，鸡头联系小姐。对小姐不要心软，人图不一的全是代聊，直接拒绝。路费都不要给。这种小姐能拿到手的都非常少，不可能有好的体验。不要对小姐的人品抱有期待，和小姐的交易必须当面完成，人走账清。人生再探索：去找同学玩，同学介绍了一家洗浴中心，398半套，技师年纪偏大，服务一流。不满意的可以换，多换几个总能找到个还行的。熟人带着才有全套。事后反省：熟人带着可以搞大活，要么就装老嫖客，技师可以私聊带出来。级别翻倍。随便搞。斗智斗勇篇洗浴中心第二天，同学给了一个QQ号，加上之后网上选人。888/p，本人选了两个1600。留下联系方式和房卡。约好时间，时间到了之后让转账后小姐上楼。觉得号是同学给的诚信有保障，遂给888。转账后暴露，各种借口让付另一半，小姐没上楼。期间双方斗智斗勇，互相忽悠。我想让对面给我把钱转回来，对面忽悠我转剩下的一半。最终恼羞成怒，报上我的姓名，扬言砍我一只手，（猜测酒店前台泄露了我的信息）同时发来一段视频，西瓜刀寒光四射。本人放话：有种上来。同时戴上口罩开门跑路，110已经拨好，随时可打。反省：任何时候都不要放松警惕，哪怕同学给的资源，不见小姐不付钱。面对卖淫团伙仙人跳威胁不要怂，他刚你更刚。报警挂嘴上。（报警流程有不熟悉的建议有机会找个小事试一下，一般会问一些信息，提前准备好，比如出警地点）安魂舒缓篇找同学玩回来，欲找个熟女安慰一下受惊的心灵。人来略坦，无奈大莱莱迷惑了我的双眼，上门后推荐闺蜜双飞，怦然心动。共计2400。无奈服务相当机车，身材走样，下面松垮垮，除了奶子可以，其余都不行。没射出来就软了。实在下不去鸡儿。反省：不要相信鸡头嘴里熟女这种东西，玛德二十多的他说是学生，30多的他说是二十的，四五十的才是他们嘴里的熟女。再次强调不要在床上相信小姐任何话，这时候男人每个清醒的，要谈也是提上裤子以后。同一个地方跌倒四次：一日兴起，招嫖，谈好价格1000pp，人来看中，付钱后准备洗漱。小姐借口自己来之前已经洗漱过了，让我自行洗漱，于是洗漱，途中和小姐聊天，指挥我洗一下鸡儿，不然口的时候不卫生。遂用肥皂擦洗，泡沫正浓时，小姐夺路而逃。跑了。又一日兴起，约好后酒店等人敲门后端详良久，这特么不是上次跑路的那个小姐，遂激动指控，逼其退钱，无奈忘记堵门，又跑了。再一日兴起，来一未成年，吓我一哆嗦，赶紧换了一个，由于兴致大起，已经洗好澡等待，准备人来直接开干。来后小姐说已经洗过澡了，没多久，提枪上马，干到一半，小姐私处异味严重，大为影响兴致。某一日，兴致再起，欲探索酒店小卡片。打电话后，人来。500一次，没啥服务，催人，质量不行，隆胸，关键隆过以后也只有B-，还特么硬，我都不敢捏，害怕摸坏了。反省：之所以是一个地方跌倒四次，是因为开房地点都在万达中心。怀疑此地有诈。各位谨慎。小姐来了以后一定要洗澡，不论她什么借口。一定要注意卫生。不健康不说，还特么影响兴致。如果洗澡前付了钱，就同时洗澡，要么洗澡之后付钱。针对上门小姐服务机车，不认真的情况，各位可以尝试事后付款。（这点要约之前就谈好，省的浪费时间），另外远离未成年，绝对不能精虫上脑。万一被抓就不是换个星球生活的事了云南之行：微信约好1600包夜，小姐来到后，外形颜值良好。遂付款开整态度良好。体验良好。两炮结束后，小姐借口上厕所，卫生间内偷偷穿戴整齐，趁机夺路而逃。一日游玩结束后，浑身酸痛，想洗个澡。打车告诉司机说去洗澡。无奈司机会错意，直接拉到一家养生馆，说有当地特色。于是体验一把。没有大活298，洗澡加按摩加轻色情服务，最后大飞机。技师相当漂亮。听话。云南少数民族农村的，后悔没加微信。反省：包夜一定要谨慎小姐偷偷溜走，思来想去只有钱给一半这个办法，这种方法也得提前说好。省的浪费时间。养生馆的小姐姐，我怎么就没要微信呢。真特么后悔。青岛之行: 是一家spa馆，只做特殊服务的那种，小姐质量超高，服务非常机车。1399打了个飞机摸了一下奶。反省：不要让妹妹迷失了双眼啊，看到漂亮姐姐就付钱是可耻的。门店会员：一家我工作城市的足浴店，挺大的，技师日常上班三四十个。质量有好有差，不满意就换，服务分档次，1000的会员，3000的会员，10000的会员。我是3000的，3000的不给口，可以打奶炮。服务挺好，单次消费666，按摩，加胸推，调情之类的，不给口，不给日。反省：足浴店的技师因为按摩脚丫子，稍有不慎就会沾染脚气，再摸你的蛋蛋，容易引起蛋蛋瘙痒，或者各种皮肤病。要谨慎啊，事后一定要用肥皂清洗自己的二弟，别图省事用纸擦擦了事。别问我怎么知道的。大本营：一个外围2000两小时，相当漂亮，服务温柔，身材也好。反省：我怎么这么穷？作者：王一标签：#原创，#知识，#经验反省

Hashtags

#原创 #知识 #经验反省

Results

3 similar posts found

Search: #tokenizer

当前筛选 #tokenizer清除筛选

探索号

@seeker_rc · Post #19726 · 05/06/2026, 02:55 AM

Find similar View

AI 大模型的「中文税」：中文比英文更费 Token，为什么？作者｜汤一涛编辑｜靖宇 Opus 4.7 刚发布那几天，X 上怨声载道。有人说一次对话就把她的 session 额度用光了，有人说同一段代码跑完的成本比上周翻了一倍多；还有人晒出自己 200 美元 Max 订阅不到两小时就触顶的截图。独立开发者 BridgeMind 承认 Claude 是世界上最好的模型，但同时也是最贵的模型。他的 Max 订阅用不到两小时就限额了，但幸好——他买了两份。｜图片来源：X@bridgemindai Anthropic 官方价格没变，每百万输入 token 仍是 5 美元，输出 25 美元。但这个版本引入了新 tokenizer，同时 Claude ... via 极客公园标签: #token#中文#tokenizer ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道：科技探索者每天推荐有趣内容，欢迎订阅、转发。

Hashtags

#token #中文 #tokenizer

Machinelearning

@ai_machinelearning_big_data · Post #7942 · 07/02/2025, 09:01 AM

Find similar View

🌟 FlexTok: адаптивная 1D-токенизация изображений от Apple. FlexTok - метод токенизации изображений, который преобразует 2D-изображения в упорядоченные 1D-последовательности переменной длины. Его цель - сократить объем данных, необходимых для обучения генеративных моделей, и при этом оставить достаточную информацию для качественной реконструкции и генерации. В отличие от традиционных подходов, где число токенов фиксировано и зависит только от размера изображения, FlexTok подстраивается под сложность контента: простейшая сцена может кодироваться несколькими токенами, а сложная - десятками и сотнями . FlexTok, это по сути, пайплайн из 3 компонентов: ViT‑энкодер, квантование регистров и маскирование внимания: ViT‑энкодер с набором «регистровых» токенов читает латентные представления VAE‑GAN и конденсирует их в 1D-последовательность до 256 регистров . Затем, с помощью FSQ‑квантования, каждый регистр дискретизируется в код из заранее определенного словаря размером ~64 000. На этом этапе применяется "nested dropout": во время обучения случайно обрезаются последние токены, чтобы модель научилась упорядочивать информацию от грубых форм к деталям. Параллельно применяется авторегрессионная маска внимания: каждый токен в цепочке видит только те, что были до него, и не знает о тех, что идут после. Это заставляет модель генерировать изображения шаг за шагом, от первого токена к последнему, и упрощает ей задачу прогнозирования следующих элементов. Декодер в FlexTok - это модель rectified flow, которая на вход берет укороченные токены и слегка зашумленные латенты VAE и учится предсказывать тот шум, который нужно убрать, чтобы вернуть исходное представление. Чтобы обучение шло быстрее и давало более точные результаты, добавляют REPA‑Loss: он сравнивает промежуточные признаки с векторами из DINOv2‑L. Благодаря этому даже при очень жесткой компрессии (от 1 до 256 токенов), FlexTok успешно восстанавливает детали изображения. FlexTok легко встраивается в текстово‑ориентированные модели и может улучшить соответствие изображения описанию, даже если число токенов меняется. К тому же его адаптивная токенизация применима не только к картинкам, но и к аудио или видео. ▶️Набор токенизаторов: 🟢Flextok_d12_d12_in1k - 12\12 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d18_in1k - 18\18 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_in1k - 18\28 слоев энкодер-декодер, датасет IN1K; 🟢Flextok_d18_d28_dfm - 18\28 слоев энкодер-декодер, датасет DFN. ▶️VAE: 🟠Flextok_vae_c4 - 4 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c8 - 8 каналов латента, коэффициент понижающей дискретизации 8; 🟠Flextok_vae_c16 - 16 каналов латента, коэффициент понижающей дискретизации 8. 🟡Страница проекта 🟡Набор на HF 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#Tokenizer#Flextok#Apple

Hashtags

#ai #ml #tokenizer #flextok #apple

Machinelearning

@ai_machinelearning_big_data · Post #9285 · 12/19/2025, 06:05 PM

Find similar View

🌟Minimax VTP: гибридный токенизатор для диффузии на стероидах. В диффузионных архитектурах считается, что масштабировать первую стадию, VAE - занятие неблагодарное. Eго задача - превратить пиксели в латентный код и обратно, а добавление ему параметров или данных никак не помогает основной модели DiT генерировать изображения лучше. MiniMax решила поменять правила игры и представила Visual Tokenizer Pre-training (VTP). Их гипотеза заключается в том, что токенизатор должен не просто механически "зиповать" пиксели, а понимать семантику изображения. Чтобы реализовать это, они объединили в обучении токенизатора сразу 3 лосса: 🟢Стандартный pixel reconstruction loss; 🟢Self-supervised learning (через Masked Image Modeling и дистилляцию, как в DINOv2); 🟢Image-text contrastive loss (как в CLIP). Это заставило латентное пространство структурироваться семантически: теперь векторы кодировали смыслы, а не просто цветовые пятна. 🟡Теоретические выкладки подтвердились на практике. Оказалось, что качество генерации напрямую зависит от "интеллекта" токенизатора. Не меняя архитектуру и гиперпараметры самого DiT и не увеличивая затраты на его обучение, просто за счет использования VTP-токенизатора удалось улучшить метрику FID на 65.8% и ускорить сходимость модели в 3 раза. 🟡Но главное открытие - это то, что заработал закон масштабирования для Stage 1. Теперь, чем больше вычислительной мощности и данных вливается в претрейн токенизатора, тем качественнее становится итоговая генерация, чего раньше с обычными VAE достичь было невозможно. 🟡В открытом доступе опубликованы 3 чекпоинта VTP с различием по количеству параметров: 🟠VTP-Large - 0.7B; 🟠VTP-Base - 0.3B; 🟠VTP-Small - 0.2B. 📌Лицензирование: MIT License. 🟡Набор моделей 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#Diffusion#Tokenizer#Minimax

Hashtags

#ai #ml #diffusion #tokenizer #minimax