Латентная диффузия в действии: знакомьтесь с обновлённой нейросетью YandexART 1.3

Компания «Яндекс» продолжает развивать свои генеративные сети. На этот раз разработчики представили миру обновлённую версию диффузионной нейросети YandexART 1.3, которая, словно талантливый художник, создаёт реалистичные изображения.

Главным нововведением стала технология латентной диффузии, пришедшая на смену каскадной. Теперь нейросеть, подобно опытному фокуснику, формирует промежуточное представление картинки в виде латентного кода — своеобразной «шпаргалки», содержащей квинтэссенцию изображения. Затем, словно по мановению волшебной палочки, этот код разворачивается в полноценный шедевр высокого разрешения всего за один шаг. Такой подход не только экономит вычислительные ресурсы, но и позволяет добиться впечатляющего качества итогового результата.

Также в «багаж знаний» нейросети были добавлены синтетические тексты — детальные описания изображений, сгенерированные самой нейросетью. Теперь датасет, на котором обучалась модель, насчитывает более 850 миллионов пар «картинка-текст». Благодаря этому YandexART научилась лучше понимать запросы пользователей и учитывать больше деталей из промта. А помогают ей в этом два текстовых энкодера — «переводчики» с человеческого языка на машинный.

Кроме того, обновлённая YandexART теперь позволяет создавать изображения в различных форматах: 16:9, 4:3 или 3:4. Теперь плоды фантазии, рождённые в Шедевруме, смогут украсить собой обложки журналов или стать стильными фотообоями на телефоне.

Нейросеть на данный момент интегрирована в Шедеврум, используется в Яндекс Бизнесе, Директе, Браузере и Маркете.

Ниже можете ознакомиться с изображениями, которые были сгенерированы при помощи YandexART.

Комментарии: 15
Ваш комментарий

Все такое гладенькое ,вылизанное,сладенькое,контрастное и насыщенное.В любой нормальной художественной школе за такое сразу по голове дадут,так как это признак плохого вкуса.

Просто держу в курсе.

5

да и выглядит все равно слишком вычурно и как то безинтересно

4

А представь как чрез 10 лет будет

1

Чушь, в реале все точно также выглядит, если у тебя зрение хорошее.

-10

>признак плохого вкуса

т.е., если кому-то не нравится, значит недолжно нравится всем, понял

1

Если в ту же Третьяковку зайти ,ты там такие работы не увидишь.Тонкость,колорит,работа с цветом,рисунок.Его тут нет просто.А что бы начать различать что хорошо,что плохо ,нужно чуть хоть насмотренность иметь за пределами картинок в интернете и комиксов.Даже если сравнить арты какие для игр рисуют художники и вот это ,тут уже огромная разница.

0

продолжает развивать свои дегенеративные сети

2

Как же печалит, когда создатели гордо отчитываются: "По результатам SBS-замеров асессорами Яндекса, нейросеть YandexART 1.3 выигрывает в 57 процентах случаев в сравнении с Midjourney V5.2", - но не приводят примеры сравнения генераций. И на презентацию выкатывают исключительно простенькие картинки, с которыми худо-бедно научилась справляться любая сеть. А потом откроешь - и получится как с "обновленным" Кандинским: художников кроме Малевича и Ван Гога ИИ не знает, запросы чуть сложней натюрмортов или портретов в точности выполнить не может, половина параметров просто выкидывается, люди в количестве более 1-2 превращаются в парад уродов, руки, ноги, пальцы и прочие части тела подсчету не подлежат... Хотя, справедливости ради, с простым тестовым запросом YandexART справился немного лучше Кандинского. Но лишь немного )

2

На запрос :кот тушканчик

2

Очередная зацензуреная шляпа, где ни шагу влево, ни шагу вправо

0

"Я не хочу говорить на эту тему" теперь и в картиночках?

0

Генерирует кайфово, а вот портретные фотки обрабатывает, пока что, грустно. Более-менее хорошо обрабатывает+стилизует женские портреты, но чуть что в сторону и уже ужасно.

У них там появилась галерея пользовательских работ (а может она была) и там можно воспользоваться фильтрами других людей, для обработки своих изображений. Норм. Но сервису ещё есть куда расти.

-2