TGTGInsightтелеграм анализLIVE / telegram public index
← Такты, стеки, два колеса

TGINSIGHT SIMILAR POSTS

Намери подобно съдържание

Изходен канал @clockstackwheels · Post #106 · 19.11

Это должен был быть выпуск про зарплаты, но я понял, что ничего нового или интересного всё-таки не скажу, да и тема слишком уж попсовая. Поэтому будет выпуск про энтерпрайз-разработку. В конце-концов, странно записывать подкаст не о том, что ты хочешь. Вообще, выпуск дался тяжело, потому что я понял, что трачу на продакшен сильно больше времени, чем готов. Поэтому данный эпизод я записал в ускоренном режиме — паузы между словами порезал автоматически, не стал вставлять никакие заставки. В двух-трёх местах это слышно, но глобально, как мне кажется, нельзя сказать, что качество упало на порядок. Несмотря на то, что я получил много действительно приятных отзывов о подкасте, какой-то фундаментальной разницы он не сделал. Подписчики — то же активное ядро моей аудитории, как и в остальных местах. При этом усилий он требует больше, чем посты, а информации позволяет передать меньше: картинки и видео уже не прикрепишь. Понятно, отчего большинство подкастов выживают только в «тяжёлом» формате: когда приглашают известных гостей и разговаривают с ними по полтора-два часа. И отдельная беда это отсутствие централизованной площадки. Недавно дал человеку ссылку на выпуск в Яндекс.Музыке, оказалось, у него нет там подписки, а без подписки внезапно Яндекс слушать даже подкасты не даёт. Пришлось давать ссылку на Телеграм, где подкаст полуофициально. Хотя вот подкасты запустили в российском Spotify, и мой там теперь тоже есть. Подумал о том, что, наверное, подкаст выродится в короткие аудио-заметки по 5 минут. Но в таком стиле классически существуют скорее видеозаписи. Наверное, от подкаста ожидается бОльшее вовлечение, а условный ютуб можно включить ненадолго за завтраком. Да, широко известно, что ютуб зачастую слушают, а не смотрят, но видимо сам факт наличия изображения что-то меняет в восприятии. Однако, если делать короткие видеоролики, то это уже какой-то ТикТок, а этого бы совсем не хотелось. Из всех взрослых людей, которых я считаю адекватными, тикток смотрят процентов 10, пожалуй. Я, возможно, найду там аудиторию, но совсем не ту, которую хотел бы. В общем, я в раздумьях. #podcast

Hashtags

Резултати

Намерени 1 подобни публикации

Търсене: #controllablegeneration

当前筛选 #controllablegeneration清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8057 · 14.07.2025 г., 18:02

🧠 Как «вклеить» объект в картинку так, чтобы он выглядел естественно? Это одна из самых сложных задач в семантической генерации: 🔸 нужно сохранить структуру сцены 🔸 вставить объект по текстовому описанию 🔸 и найти уместное место, а не просто налепить поверх Большинство моделей с этим не справляются — объект добавляется не к месту или портит фон. Новый метод Add-it от NVIDIA решает эту задачу без обучения модели. Он расширяет механизм внимания в диффузионных моделях, чтобы учитывать сразу три источника: 1. Оригинальное изображение 2. Текстовый промпт 3. Промежуточную сгенерированную картинку 📌 Такой подход позволяет: – сохранить геометрию сцены – встроить объект туда, где он действительно мог бы быть – не терять мелкие детали и текстуры 📊 Результаты: – Add-it без дообучения обходит supervised‑модели – На новом бенчмарке Additing Affordance показывает SOTA результат по «естественности размещения» – В слепых тестах люди выбирают его в 80% случаев – Улучшает метрики качества генерации 🟠Github: https://github.com/NVlabs/addit 🟠Demo: https://huggingface.co/spaces/nvidia/addit 🟠Paper: https://arxiv.org/abs/2411.07232 🟠Project: https://research.nvidia.com/labs/par/addit/ @ai_machinelearning_big_data #NVIDIA#Diffusion#Addit#StableDiffusion#AIgen#ControllableGeneration