ИИ на подиуме: как нейросеть шьет коллекцию по промтам
Представьте инструмент, который может не только предугадать завтрашние тренды, но и нарисовать их еще до того, как они появятся на подиуме.

Генеративный искусственный интеллект меняет мир моды. Специальные алгоритмы учатся на огромных массивах данных — текстов и изображений — и создают на их основе новое. Это не просто автоматизация, а мощный инструмент для дизайнеров, который раскрывает креативность, ускоряет работу над коллекциями и выводить продукты на рынок.
Такие модели, как чат-бот ChatGPT и генератор изображений DALL-E, уже доказали свою пользу в разных сферах. В индустрии моды они помогают профессионалам и просто энтузиастам разобраться в истории стилей и спрогнозировать, что будет актуально завтра. Эти идеи затем превращаются в запросы для нейросетей, которые рисуют реальные эскизы для будущих коллекций. Вопрос теперь не в том, использовать ли ИИ, а в том, как сделать это грамотно.
Эту задачу и взялись решить профессор Юн Кюн Ли и магистрант Чаехи Рю из Национального университета Пусан. Они исследовали, как с помощью генеративного ИИ можно визуализировать сезонные тренды.
Чтобы эффективно применять ИИ в моде, нужно глубоко понимать, как работают эти модели и где именно их стоит задействовать, — объясняет профессор Ли. — В нашей работе мы изучили, как с помощью грамотно составленных текстовых запросов можно создавать реалистичные изображения коллекций.
Ученые поступили так:
- Сначала они поручили ChatGPT-3.5 и ChatGPT-4 проанализировать исторические данные по мужской моде до сентября 2021 года и на их основе спрогнозировать тренды на осень/зиму 2024.
- Элементы дизайна из прогноза ИИ стали «исходными кодами». Их дополнили „измененными кодами“ из обзора трендов от Vogue и „кодами из литературы“ — данными из академических работ по дизайну.
- Весь этот массив информации проанализировали и свели в шесть ключевых групп: общие тренды, силуэты, материалы, ключевые предметы одежды, детали и декор.
На основе этой структуры для DALL-E 3 составили 35 детальных текстовых запросов (промтов), каждый из которых описывал уникальный образ. Запросы строились по единому шаблону: «мужская модель выходит на подиум показа осень/зима 2024». Шаблон позволял гибко менять ракурс съемки, внешность модели, оформление подиума, фон и настроение. Каждый промт запустили трижды и получили 105 изображений.
Результаты впечатлили, но показали и ограничения. DALL-E 3 идеально справился с запросом в 67,6% случаев. Лучше всего нейросеть понимала запросы с уточняющими прилагательными. Некоторые сгенерированные образы были очень похожи на то, что потом представили реальные бренды. Однако возникли и сложности: большинство образов получились слишком похожими на готовую одежду (ready-to-wear), а такие сложные концепции, как гендерная текучесть, модель отобразила с трудом. Оказалось, что просто указать трендовое ключевое слово недостаточно — нейросети нужно больше обучаться на модных данных.
Наши результаты показывают, что для точной реализации задумки нужны экспертно составленные промты, — подчеркивает профессор Ли. — Это доказывает ключевую роль экспертов в моде. С дальнейшим обучением и развитием модели вроде DALL-E 3 помогут дизайнерам эффективнее создавать целые коллекции, не ограничивая, а дополняя их творчество. А еще это поможет обычным людям лучше понимать тренды.
В итоге генеративный ИИ становится мощным инструментом не только для профи, но и для всех, кто интересуется модой, позволяя каждому легко и уверенно исследовать, предсказывать и составлять стильные образы на грядущий сезон.
Реальная польза этого исследования — в его сугубо прикладном характере. Оно не просто рассуждает о возможностях ИИ, а предлагает конкретную методологию работы с ним.
- Структурирование творчества: ИИ генерирует хаотичные, порой безумные идеи. Исследование предлагает алгоритм, как обуздать этот поток: от анализа данных и прогноза до систематизации элементов дизайна и составления точных промтов. Это превращает генерацию изображений из развлечения в рабочий инструмент дизайнера.
- Ускорение начальных стадий: Самый трудоемкий этап — поиск концепции и создание первых эскизов. ИИ, обученный на этом исследовании, может за несколько минут выдать сотни вариаций на основе актуальных трендов, что сэкономит дизайнерам дни и даже недели работы. Это не заменяет человека, а дает ему мощный старт.
- Демократизация дизайна: Методология с четкими «кодами» (силуэты, материалы, детали) позволяет и не-профессионалам, например, маркетологам или владельцам малого бизнеса, визуализировать свои идеи, общаясь с нейросетью на понятном ей языке. Это снижает порог входа в индустрию.
Основная методологическая слабость исследования заключается в ретроспективной валидации результатов. Ученые сравнивали сгенерированные ИИ изображения с реальными коллекциями осени/зимы 2024, которые были представлены после того, как был проведен анализ и сделан прогноз. Однако сам прогноз трендов от ChatGPT, сделанный в 2023 году, основывался на данных только до сентября 2021 года. Это означает, что модель не видела и не анализировала коллекции 2022 и 2023 годов, которые являются непосредственным и ключевым предшественником и источником вдохновения для коллекций 2024 года. Таким образом, высокая степень соответствия некоторых изображений реальным коллекциям может быть в определенной степени случайной или обусловленной общеизвестными, консервативными трендами, а не точностью прогноза. Для чистоты эксперимента валидацию следовало бы провести на будущих, еще не известных на момент прогноза трендах (например, на сезон осень/зима 2025 или 2026).
Ранее мы простыми словами рассказали, что такое генеративный ИИ.



















