TGTGInsighttelegram intelligenceLIVE / telegram public index
← GZ学习频道

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @olddriverGDstudy · Post #29 · Mar 17

搜索使用说明 #搜索指南 因为电报软件对中文搜索支持不好,大队特别对队内资源搜索进行了整理汇集,使用方法说明如下: 1.1 原理: 电报对中文搜索支持不佳,汉字只有在前后含有asic码字符的前提下可以被正确搜索出,如 _广州修车大队_ (“_”指代空格)、(广州修车大队);等形式可以搜索“广州修车大队”搜索出相关信息;搜索“广州”等未被asic码间隔的汉字无法正确显示。 为正确搜索,在编制频道资源时,对重要信息可以采取Hashtag的形式已方便搜索,即以"#"字符开头,接汉字,以“空格字符”结尾的形式,点击一个hashtag即可快速定位该频道或聊天群内所有相同标签,建议所有管理在编辑重要资料包括ls信息、广播台、学习频道时正确使用hashtag。 !!注意标签不要随意编写,要参考搜索指南中有的标签类型!! 1.2 JS资源定位: JS目前支持 Hasgtag(#K老师)、数字标签(#GZ003)的搜索方式,在对应榜单和报告区中试用上述方式均可查找到JS的相关信息。 使用举例:在“广州公开榜”或“广州修车大队”的搜索栏中输入 #K老师 或 #GZ003,均可定位到K老师资料页;在报告区的搜索栏中输入#K老师 或 #GZ003,均可定位到K老师的验证报告。这两者是快速了解JS基本信息和评价的便捷办法。 1.3 标签查找 公榜榜单目前均支持标签查找,可以快速定位某种类型或地区的所有JS,目前仅支持Hashtag查找,目前常用标签解释如下: 地区标签: 一定要使用一级标签,例如 #天河区(注意不要有错别字) #颜值: 不解释 #服务: 评价中92、95的,有场子出身花式水平的,均会归入此类; #大胸: 不解释,一般D以上归入此类; #长腿: 不解释,一般168以上归入此类; #身材: 不解释,较为宽松; #嫩妹: 22岁以下或者长相很嫩的,白小纯的,loli系的,cos系的归入此类; #熟女: 30岁以上风韵犹存的,归入此类; #特服: 提供3p、3t、wt、字母等特殊服务的JS归入此类。 使用举例:在红榜的搜索栏中输入 #长腿,可以快速查看“莉贝伦”等8位长腿JS。 类型标签评价目前非常主观,有不妥之处请队内私信 JackJack 或其他管理人员修改。 1.4 资料查找 目前学习频道中试用hashtag来快速定位资料,目前使用的标签有如下几种: #安全CJ#素质CJ#卫生CJ #搜索指南 #大队玩法 #语录#秀哥语录 #技巧#知识

Results

10 similar posts found

Search: #diffusion

当前筛选 #diffusion清除筛选
Assuna

@assuna_lives · Post #423 · 04/30/2026, 10:27 PM

Apple выпустила необычную ИИ-модель для разработчиков Apple тихо выложила на Hugging Face новую модель DiffuCoder-7B-cpGRPO с интересной особенностью. Вместо классической генерации кода слева направо, она может писать код в любом порядке и улучшать несколько блоков одновременно, что делает генерацию быстрее. Модель основана на диффузионном подходе (как в Stable Diffusion для картинок) и построена поверх Qwen2.5-7B от Alibaba. Показала прирост 4.4% на популярных бенчмарках моделей для программирования. Особенность: регулируя температуру, можно менять порядок генерации токенов - от строгого последовательного до гибкого хаотичного. #Apple#Coding#Diffusion ------ @tsingular

科技&趣闻&杂记

@kejiqu · Post #3614 · 07/05/2025, 06:44 AM

Character.AI 突破性技术:实时 AI 角色视频互动 Character.AI 发布名为 TalkingMachines 的自回归扩散模型,旨在增强 AI 角色互动真实感。该模型基于 Diffusion Transformer(DiT)技术,通过流匹配扩散、音频驱动的交叉注意力、稀疏因果注意力和不对称蒸馏等技术,实现类似 FaceTime 的实时通话视觉互动。用户仅需输入图片和声音信号,即可生成逼真的 AI 角色动作,支持多种风格。TalkingMachines 强调其为实时音频视觉 AI 角色发展的重要一步。IT之家 🏷#TalkingMachines#Character#AI#Diffusion 📢频道👥群组📝投稿

Machinelearning

@ai_machinelearning_big_data · Post #9285 · 12/19/2025, 06:05 PM

🌟Minimax VTP: гибридный токенизатор для диффузии на стероидах. В диффузионных архитектурах считается, что масштабировать первую стадию, VAE - занятие неблагодарное. Eго задача - превратить пиксели в латентный код и обратно, а добавление ему параметров или данных никак не помогает основной модели DiT генерировать изображения лучше. MiniMax решила поменять правила игры и представила Visual Tokenizer Pre-training (VTP). Их гипотеза заключается в том, что токенизатор должен не просто механически "зиповать" пиксели, а понимать семантику изображения. Чтобы реализовать это, они объединили в обучении токенизатора сразу 3 лосса: 🟢Стандартный pixel reconstruction loss; 🟢Self-supervised learning (через Masked Image Modeling и дистилляцию, как в DINOv2); 🟢Image-text contrastive loss (как в CLIP). Это заставило латентное пространство структурироваться семантически: теперь векторы кодировали смыслы, а не просто цветовые пятна. 🟡Теоретические выкладки подтвердились на практике. Оказалось, что качество генерации напрямую зависит от "интеллекта" токенизатора. Не меняя архитектуру и гиперпараметры самого DiT и не увеличивая затраты на его обучение, просто за счет использования VTP-токенизатора удалось улучшить метрику FID на 65.8% и ускорить сходимость модели в 3 раза. 🟡Но главное открытие - это то, что заработал закон масштабирования для Stage 1. Теперь, чем больше вычислительной мощности и данных вливается в претрейн токенизатора, тем качественнее становится итоговая генерация, чего раньше с обычными VAE достичь было невозможно. 🟡В открытом доступе опубликованы 3 чекпоинта VTP с различием по количеству параметров: 🟠VTP-Large - 0.7B; 🟠VTP-Base - 0.3B; 🟠VTP-Small - 0.2B. 📌Лицензирование: MIT License. 🟡Набор моделей 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#Diffusion#Tokenizer#Minimax

Machinelearning

@ai_machinelearning_big_data · Post #9496 · 02/09/2026, 02:33 PM

⚡️Вышла Z-Image Base. Tongyi выложила фундаментальную версию модели семейства Z-Image. В отличие от ранее выпущенной Turbo, это полновесный трансформер, ориентированный на максимальное качество и управляемость генерации . Z-Image отлично подходит для дообучения, тренировки LoRA и интеграции с ControlNet. Модель поддерживает CFG и работу с негативными промптами, генерируя результат за 28–50 шагов. 📌Лицензирование: Apache 2.0 License. 🟡Модель 🟡Демо HF 🟡Демо ModelScope 🟡Archive 🟡ComfyUI WorkFlow 🖥GitHub @ai_machinelearning_big_data #AI#ML#Diffusion#ZImage#Tongyi

科技&趣闻&杂记

@kejiqu · Post #4198 · 02/25/2026, 01:39 AM

Inception 发布 Mercury 2,首个基于扩散的语言推理模型 Inception 发布了 Mercury 2,一款首个基于扩散的语言推理模型。与传统语言模型不同,Mercury 2 通过并行完善整个段落来生成文本,速度提升超过五倍。该模型并非逐字生成文本,从而实现了更快的推理速度。THE DECODER 🏷#Inception#Mercury#Diffusion#based#LLM 📢频道👥群组📝投稿

Machinelearning

@ai_machinelearning_big_data · Post #8057 · 07/14/2025, 06:02 PM

🧠 Как «вклеить» объект в картинку так, чтобы он выглядел естественно? Это одна из самых сложных задач в семантической генерации: 🔸 нужно сохранить структуру сцены 🔸 вставить объект по текстовому описанию 🔸 и найти уместное место, а не просто налепить поверх Большинство моделей с этим не справляются — объект добавляется не к месту или портит фон. Новый метод Add-it от NVIDIA решает эту задачу без обучения модели. Он расширяет механизм внимания в диффузионных моделях, чтобы учитывать сразу три источника: 1. Оригинальное изображение 2. Текстовый промпт 3. Промежуточную сгенерированную картинку 📌 Такой подход позволяет: – сохранить геометрию сцены – встроить объект туда, где он действительно мог бы быть – не терять мелкие детали и текстуры 📊 Результаты: – Add-it без дообучения обходит supervised‑модели – На новом бенчмарке Additing Affordance показывает SOTA результат по «естественности размещения» – В слепых тестах люди выбирают его в 80% случаев – Улучшает метрики качества генерации 🟠Github: https://github.com/NVlabs/addit 🟠Demo: https://huggingface.co/spaces/nvidia/addit 🟠Paper: https://arxiv.org/abs/2411.07232 🟠Project: https://research.nvidia.com/labs/par/addit/ @ai_machinelearning_big_data #NVIDIA#Diffusion#Addit#StableDiffusion#AIgen#ControllableGeneration

GitHub Trends

@githubtrending · Post #15091 · 08/24/2025, 11:30 AM

#python#comfyui#diffusion#flux#genai#mlsys#quantization Nunchaku is a fast and efficient engine that runs 4-bit neural networks using a special method called SVDQuant, which compresses models to use less memory and speed up processing by 2 to 5 times compared to older methods. It supports advanced AI models for tasks like high-quality text-to-image generation and image editing, working best on modern NVIDIA GPUs. You can easily install and use it with ComfyUI, and it has active community support on Slack, Discord, and WeChat. This means you can generate or edit images quickly with less computing power, saving time and resources. It also offers tutorials and example workflows to help you get started smoothly. https://github.com/nunchaku-tech/ComfyUI-nunchaku

Machinelearning

@ai_machinelearning_big_data · Post #8817 · 10/20/2025, 08:41 PM

⚡️BERT is just a Single Text Diffusion Step Любопытны пост, где автор объяснил на примере очень простую и очевидную, но мощную идею. Он заметил, что то, что мы называем диффузией текста, на самом деле - это просто обобщённая версия классического обучения BERT. Как работаетBERT? В BERT модель берёт текст и маскирует часть слов, а потом учится угадывать, какие слова были скрыты. В диффузии происходит почти то же самое, только шагов больше: на каждом шаге модель немного «портит» текст (добавляет шум), а затем восстанавливает его, всё меньше и меньше теряя смысл, пока не соберёт финальный чистый текст. То есть BERT делает один шаг очистки - угадывает замаскированные слова. А диффузионная модель делает много таких шагов подряд, постепенно превращая случайный набор токенов в осмысленный текст. Барри дообучил RoBERTa, чтобы показать это на практике - и получил настоящий текстовый диффузионный генератор. В примере: - Используется RoBER (улучшенная версия модели BERT,) и датасет WikiText. - На каждом шаге часть токенов заменяется на <MASK>, модель восстанавливает их, потом снова маскирует — и так несколько раз. - После нескольких итераций модель способна генерировать связный текст, даже без автогенеративного декодера (как у GPT). 📈Результаты - Модель генерирует осмысленный текст, хотя и не идеально связный. - Качество улучшалось по мере добавления шагов диффузии. - По времени генерации RoBERTa Diffusion была немного медленнее, чем GPT-2 (~13 сек против 9 сек), но архитектура осталась полностью encoder-only. Автор упоминает, что позже наткнулся на работу DiffusionBERT, где идею реализовали глубже и подтвердили результатами. Главная мысль: BERT можно считать одноступенчатой версией текстовой диффузии. Если добавить больше шагов, то vs получаем диффузионный генератор текста. Если BERT - это один шаг диффузии, то будущее может принадлежать моделям, совмещающим "понимание" и "генерацию" текста в одном процессе. https://nathan.rs/posts/roberta-diffusion/ @ai_machinelearning_big_data #AI#Diffusion#RoBERTa#BERT#LanguageModel#MLM#Research

GitHub Trends

@githubtrending · Post #15362 · 12/23/2025, 03:30 PM

#python#audio_generation#diffusion#image_generation#inference#model_serving#multimodal#pytorch#transformer#video_generation vLLM-Omni is a free, open-source tool that makes serving AI models for text, images, videos, and audio fast, easy, and cheap. It builds on vLLM for top speed using smart memory tricks, overlapping tasks, and flexible resource sharing across GPUs. You get 2x higher throughput, 35% less delay, and simple setup with Hugging Face models via OpenAI API—perfect for building quick multi-modal apps like chatbots or media generators without high costs. https://github.com/vllm-project/vllm-omni

GitHub Trends

@githubtrending · Post #14988 · 07/23/2025, 12:00 AM

#python#deep_learning#diffusion#flax#flux#hacktoberfest#image_generation#image2image#image2video#jax#latent_diffusion_models#pytorch#score_based_generative_modeling#stable_diffusion#stable_diffusion_diffusers#text2image#text2video#video2video The Hugging Face Diffusers library is a powerful and easy-to-use tool for generating images, audio, and 3D molecular structures using advanced diffusion models. It offers ready-to-use pretrained models and flexible components like pipelines, schedulers, and model building blocks, allowing you to quickly create or customize your own diffusion-based projects. Installation is simple via pip or conda, and you can generate high-quality outputs with just a few lines of code. This library benefits you by making cutting-edge AI generation accessible, customizable, and efficient, whether you want to run models or train your own[1][2][5]. https://github.com/huggingface/diffusers