Латентная диффузия в действии: знакомьтесь с обновлённой нейросетью YandexART 1.3

Компания «Яндекс» продолжает развивать свои генеративные сети. На этот раз разработчики представили миру обновлённую версию диффузионной нейросети YandexART 1.3, которая, словно талантливый художник, создаёт реалистичные изображения.

Главным нововведением стала технология латентной диффузии, пришедшая на смену каскадной. Теперь нейросеть, подобно опытному фокуснику, формирует промежуточное представление картинки в виде латентного кода — своеобразной «шпаргалки», содержащей квинтэссенцию изображения. Затем, словно по мановению волшебной палочки, этот код разворачивается в полноценный шедевр высокого разрешения всего за один шаг. Такой подход не только экономит вычислительные ресурсы, но и позволяет добиться впечатляющего качества итогового результата.

Также в «багаж знаний» нейросети были добавлены синтетические тексты — детальные описания изображений, сгенерированные самой нейросетью. Теперь датасет, на котором обучалась модель, насчитывает более 850 миллионов пар «картинка-текст». Благодаря этому YandexART научилась лучше понимать запросы пользователей и учитывать больше деталей из промта. А помогают ей в этом два текстовых энкодера — «переводчики» с человеческого языка на машинный.

Кроме того, обновлённая YandexART теперь позволяет создавать изображения в различных форматах: 16:9, 4:3 или 3:4. Теперь плоды фантазии, рождённые в Шедевруме, смогут украсить собой обложки журналов или стать стильными фотообоями на телефоне.

Нейросеть на данный момент интегрирована в Шедеврум, используется в Яндекс Бизнесе, Директе, Браузере и Маркете.

Ниже можете ознакомиться с изображениями, которые были сгенерированы при помощи YandexART.

Комментарии: 15

Ваш комментарий

VIGITAL1 24 апреля

Все такое гладенькое ,вылизанное,сладенькое,контрастное и насыщенное.В любой нормальной художественной школе за такое сразу по голове дадут,так как это признак плохого вкуса.

Просто держу в курсе.

RedVakzal 24 апреля

да и выглядит все равно слишком вычурно и как то безинтересно

Kitocun RedVakzal 24 апреля

А представь как чрез 10 лет будет

AndralStormborn 24 апреля

Чушь, в реале все точно также выглядит, если у тебя зрение хорошее.

-10

Sunset_Neko 25 апреля

>признак плохого вкуса

т.е., если кому-то не нравится, значит недолжно нравится всем, понял

VIGITAL1 Sunset_Neko 25 апреля

Если в ту же Третьяковку зайти ,ты там такие работы не увидишь.Тонкость,колорит,работа с цветом,рисунок.Его тут нет просто.А что бы начать различать что хорошо,что плохо ,нужно чуть хоть насмотренность иметь за пределами картинок в интернете и комиксов.Даже если сравнить арты какие для игр рисуют художники и вот это ,тут уже огромная разница.

Случайный Игрок 24 апреля

продолжает развивать свои дегенеративные сети

Skessa 24 апреля

Как же печалит, когда создатели гордо отчитываются: "По результатам SBS-замеров асессорами Яндекса, нейросеть YandexART 1.3 выигрывает в 57 процентах случаев в сравнении с Midjourney V5.2", - но не приводят примеры сравнения генераций. И на презентацию выкатывают исключительно простенькие картинки, с которыми худо-бедно научилась справляться любая сеть. А потом откроешь - и получится как с "обновленным" Кандинским: художников кроме Малевича и Ван Гога ИИ не знает, запросы чуть сложней натюрмортов или портретов в точности выполнить не может, половина параметров просто выкидывается, люди в количестве более 1-2 превращаются в парад уродов, руки, ноги, пальцы и прочие части тела подсчету не подлежат... Хотя, справедливости ради, с простым тестовым запросом YandexART справился немного лучше Кандинского. Но лишь немного )

TameIgnacio 25 апреля

На запрос :кот тушканчик

AAAndroid 25 апреля

Установил Фокус и проблем не знаю

Kozlina31 25 апреля

что за фокус?

AAAndroid Kozlina31 25 апреля

Fooocus

Jarvis666 25 апреля

Очередная зацензуреная шляпа, где ни шагу влево, ни шагу вправо

Кей Овальд 25 апреля

"Я не хочу говорить на эту тему" теперь и в картиночках?

Danny Lamb 24 апреля

Генерирует кайфово, а вот портретные фотки обрабатывает, пока что, грустно. Более-менее хорошо обрабатывает+стилизует женские портреты, но чуть что в сторону и уже ужасно.

У них там появилась галерея пользовательских работ (а может она была) и там можно воспользоваться фильтрами других людей, для обработки своих изображений. Норм. Но сервису ещё есть куда расти.

-2