Post #529

@clockstackwheels

Такты, стеки, два колеса

Прегледи452Брой прегледи

Публикувано4.0904.09.2022 г., 18:19

Съдържание на публикацията

Съдържание

Я погонял немного и Midjourney и Stable Diffusion. Если кратко: статьи в интернете приукрашивают реальность, а нейросети НЕ отнимут у художников работу. Прорыв в генеративных нейросетях безусловно есть. Сам факт того, что компьютер может создать картину, на которой действительно изображено то, что написано в тексте, уже достаточно впечатляет. Но в реальности результат работы будет применим в двух случаях: Во-первых, вам может быть не важно, как именно нарисовано то, что вы попросили. Допустим, вам нужно изображение красного робота, но это всё. Будет ли это красный Терминатор портретом, красный Робокоп в полный рост, красный Джонни 5 с цепью — вам не суть важно. Ваша задача может не подразумевать конкретики, и здесь нейросетка через некоторое число попыток выдаст вам то, что подойдёт. Во-вторых, сами объекты, которые вы просите нарисовать, могут в реальной жизни не иметь точных запоминающихся деталей. Если вам сказать "гора", вряд ли вы представите конкретные углы склонов и число трещин. Десятки и сотни вариантов горы для вас всё ещё "гора". Поэтому такие сетки прекрасно рисуют пейзажи, причем, любые: от земных до фантастических инопланетных. И всякие монстры тоже получаются неплохо, частично по этой причине, частично по описанной в первом пункте. Но на этом и всё. Если вам нужна конкретика и детали, то ситуация примерно такая: вы долгие часы учитесь составлять правильный запрос к нейросети, изучаете гайды и примеры, а потом ещё более долгие часы пробуете десятки и сотни вариантов, и всё равно конечный результат будет лишь в некоторой мере соответствовать тому, что вы хотите. Уже написаны онлайн-сервисы, позволяющие составить запрос, что, на мой взгляд, противоречит сути этой технологии ("пишешь на естественном языке, как рассказал бы художнику, и получаешь результат"). И ещё, если посмотреть на запросы других людей, там постоянно добавляют всякие гиперболизирующие слова типа "ultra hyper detailed", хотя в жизни мы так не говорим. Ну и отдельно меня позабавила в половине промптов к Midjourney фраза "trending on artstation", то есть "нарисуй мне похоже на то, что набирает популярность на сайте Artstation". Люди пишут это не потому что хотят, а потому что добавление этих слов улучшает качество в некоторых сценариях. Пару дней назад прогремела новость, как человек выиграл конкурс художников, принеся туда картинку из нейросети. Первое место получил. Нейросети точно сократят объем работы там, где не важно, что именно, и/или не важно, как именно. В абстракциях, в мемах, в бюджетной рекламе. Но пространство для найма художников всё ещё очень высоко. Stable Diffusion это open source генеративная сеть, которую опубликовали не так давно. Она даёт менее художественный результат, чем Midjourney, но её появление всё равно очень важно: помимо того, что она бесплатна, а за всё остальное требуют денег или даже вообще не дают доступ вне закрытых групп, есть ещё значимый аспект — на её основе энтузиасты уже делают форки, позволяющие, например, запускать вычисления на слабых домашних видеокартах (с потерей скорости), улучшающие интерфейс или дающие возможность загрузить пачку текстов и оставить работать на всю ночь. Такие функции делают Stable Diffusion удобнее, чем даже платный вариант других сетей. А ещё у неё есть режим "нарисовать на основе другой картинки", который я пока не попробовал, но звучит многообещающе. На предпоследней фотке я попытался нарисовать свою аватарку. А последний запрос вообще ни одна сеть не взяла даже после десятков попыток.