Генеративный ИИ просто забавная игрушка или он может реально помочь нам в жизни?

Безусловно, ИИ трансформирует работу программистов, режиссеров и финансистов. Однако возникает вопрос: что это означает для остальных жителей планеты? Мы в AI EQ стремимся понять практические применения новейших потребительских технологий искусственного интеллекта, чтобы выявить их реальную ценность.


🚀 Хочешь улететь на Луну вместе с нами? Подписывайся на CryptoMoon! 💸 Новости крипты, аналитика и прогнозы, которые дадут твоему кошельку ракетный ускоритель! 📈 Нажмите здесь: 👇

CryptoMoon Telegram


В наши дни я часто испытываю чувство неловкости при просмотре генеративного искусства. Это уже не то ощущение тошноты от изображений с дополнительными пальцами или пейзажей, нарушающих физические законы, поскольку современное AI-сгенерированное искусство в целом более стабильно визуально. Однако остается что-то другое, что вызывает во мне беспокойство.

Неприятное ощущение, которое я испытываю, тесно связано с продолжающимися дискуссиями о роли подобных инноваций. В различных областях, таких как кино, телевидение, игры и реклама, это привело к потере рабочих мест, победам в запретах и постоянным дебатам относительно их значимости в творческой сфере. Несмотря на то, что эта аргументация не показывает признаков ослабления, технологии генеративного искусственного интеллекта продолжают развиваться и улучшаться – становясь менее жуткими, более культурно чувствительными, быстрыми и даже захватывающими (темная или светлая магия зависит от точки зрения).

Во многих обсуждениях о нем часто упускают из виду его повседневную значимость для людей вне художественного поля, индустрии визуальных эффектов и тех, кто не занимается созданием цифровых миров. Итак, можно задаться вопросом: служит ли Генеративное искусство практической цели тем, кто не принадлежит к этим категориям? Имеет ли оно место в нашей повседневной жизни?

Во время моего первого теста системы Adobe Firefly, ИИ-системы разработанной создателями Photoshop, я задумался над одним конкретным вопросом. Adobe Firefly позиционируется как инструмент для профессиональных художников и дизайнеров, предоставляя средство для упрощения рутинных задач, автоматического создания высококачественных ресурсов и позволяющее коммерческое использование благодаря обучению на материалах, не защищенных авторским правом.

Подобно многим другим инструментам для творчества, он предлагает удобный интерфейс пользователя, однако иногда его применения могут быть загадочными. И это не только мой опыт — я сталкивался с затруднениями при попытках найти настоящие, практические цели использования Генеративного Искусственного Интеллекта (ИИ), помимо создания забавных или бессмысленных изображений для друзей и семьи. В поисках более ощутимых применений я углубился в тему и вот что выяснил.

Дело молодых креативщиков

История началась с того момента, когда я послушал кампанию моего друга по Dungeon & Dragons в выходные. Его рассказы о кампаниях, персонажах и приключениях были захватывающими. После нескольких часов прослушивания я попросил его нарисовать своих героев, задаваясь вопросом, сможет ли искусственный интеллект оживить творения этого юного художника младше 12 лет. Он показал мне простые, но невероятно изобретательные рисунки, изображающие несколько персонажей: воина блондина с топором и уникального персонажа наполовину человека, наполовину ящера – мастера фехтования, который также отличался мастерством в стрельбе из лука.

Я попытался анимировать изображение с помощью инструмента Image to Video от Firefly, ожидая, что оно оживет пламенем. Однако вместо этого появившаяся ИИ-созданная рука подожгла рисунок человека-лизарда на бумаге, что было как завораживающе, так и слегка пугающе, но не совсем то, чего мы ожидали.

Я обнаружил больше успеха при использовании Text to Image. В описании первого персонажа я изобразил мускулистого мужчину без рубашки с головой дракона; он несёт лук и меч, одетый в мешковатые брюки, средневековые сапоги и колчан со стрелами на спине. Для второго персонажа описание было таким же: мускулистый воин без рубашки с длинными светлыми волосами и чёрной маской, скрывающей глаза; он владеет луком и боевым топором, также носит мешковатые штаны, высокие чёрные ботинки и колчан со стрелами за спиной. Результаты оказались выдающимися — реакция была смешанной. Он оценил хорошую физическую форму персонажей (как и ожидалось, учитывая его стремление к фигуре Конана-варвара в своих рисунках), но всё же предпочитает собственные работы. Неясно, что он планирует делать с этими иллюстрациями; они кажутся ему интересными, однако не впечатляют.

Персонажи D&D оживают.

Сгенерировано Adobe Firefly Text to Image.

Как энтузиаст искусства, я передал эту работу моему подростку-художнику, впечатляющее портфолио которого обеспечило ему место в программе изобразительного искусства известной старшей школы. У него множество уникальных персонажей в стиле аниме. Я усадил его за компьютер и дал волю действиям. Они выбрали Generative Fill как инструмент для создания персонажей. Удивительно, но они сохраняли некоторое почтение к самому искусству, сосредоточившись на улучшении фона. Это оказалось весьма полезным… эффективный способ, который позволял им размещать персонажа Кой в разных обстановках и фоне. Будет ли это полезно моему ребенку? Он намекнул, что возможно, с легкой двусмысленностью. Позже я обнаружил его полностью погруженным в добавление фона к другому персонажу из своего альбома карандашом.

Я признаю, что развитие персонажа не обязательно приносит пользу сразу же, но планирую рассмотреть больше приложений для взрослой аудитории позже. Однако я все еще считаю, что внедрение этой технологии среди юных художников соответствует видению Adobe для Firefly: вдохновлять, ускорять идеи и предоставлять быстрые пути к искусству. Сгенерированные произведения действительно оправдали эти ожидания. Более того, молодые художники были заинтригованы ими, но не слишком увлечены (что могло бы быть моей реакцией, если бы я столкнулся с этим удивительным инструментом рисования в 90-х годах). Они оценили творения и вернулись к своему собственному творческому процессу. Возможно, будущее поколение полностью поймет потенциал этой технологии.

Fashion Forward

Как энтузиаст моды я был восхищён демонстрацией Генеративной Заполняемости и стремился применить её в реальном мире — шопинге для своего стильного подростка. Несмотря на их безупречный вкус, уникальные предпочтения делают процесс покупки сложным. Традиционные методы, такие как покупка предметов или попытки описать желаемое, приводят к ненужному стрессу и дорогостоящим недопониманиям. Однако Генеративная Заполняемость оказалась идеальным решением для смены нарядов. Охватив область изображения (или рисунка) кругом и описав предмет одежды, она волшебно генерирует стандартный вариант этого предмета, заменяя предыдущую одежду.

Я наткнулся на привлекательное изображение моего подростка и решил поискать подходящий стиль одежды. Я использовал инструмент для выделения их рук и верхней части тела, а затем поискал ‘черный свитер’. Он оказался идеальным! Все предложенные варианты подходили (ведь черный — их любимый цвет). Когда я выделил их ноги и ввел в поиск ‘черная короткая юбка’, результаты не были такими же (возможно, система предположила, что родитель делает запрос, поэтому предложила длинные, формальные и красочные юбки вместо этого). Вместо этого это послужило поводом для обсуждения их предпочтений. Теперь я достаточно уверен, чтобы купить им свитера. Думаю, было бы лучше, если бы они сами выбрали себе юбки при покупках.

Генерация книги стилей

Создано с помощью инструмента генеративной заливки от Adobe Firefly.

Немного маркетинга

Когда я продвигался по пути, открывая больше практических применений этому инструменту, мне потребовалась базовая маркетинговая поддержка. Каждому было бы полезно иметь команду маркетологов – будь то организация гаражной распродажи, сбор средств на медицинские расходы или попытка продать старый велосипед. Небольшой штрих визуального маркетинга значительно повышает шансы успеха в таких делах. Это умение у меня лично отсутствует.

Изначально я подумывал обратиться за помощью для улучшения моего скромного отпуска в Поконосе, который сейчас размещен на Airbnb. Фотографии у меня есть, но они функциональные и не слишком привлекательные. Чтобы создать что-то более заманчивое без найма профессионального фотографа, у меня появилась идея – сделать короткий промовидео или, как некоторые называют, «сизл рейл». Используя функцию Image to Video в Firefly, одном из их самых креативных инструментов, я попытался собрать различные сцены. Мой дом украшен декором космической тематики, поэтому начал генерировать кадры, которые бы подчеркивали эту уникальную особенность. Я сделал снимок главного ложа кровати под рамкой с изображением космического аппарата «Вояджер» (в реальности) и попросил камеру приблизить фото, а затем сымитировать полет через Млечный Путь (сгенерированный искусственным интеллектом). Это видео я сохранил как фоновое или B-roll. Затем я заставил камеру пролететь над кухней, пересечь обеденный стол и приземлиться на постер с изображением горы Олимп на Марсе. После еще нескольких поездок по дому я оценил свою коллекцию B-roll кадров. Результат оказался не тем, чего я ожидал – вместо эффективного маркетингового инструмента для необычного отпуска получилось что-то напоминающее ролик из программы Тима и Эрика о зимних видах спорта. Иначе говоря, это было необычно, но с точки зрения показа дома перед публикой я отошел от привычного пути. Буду придерживаться найма традиционного фотографа по недвижимости.

Я обнаружил более успешный подход при создании плаката для нашего благотворительного мероприятия. Как член исполнительного совета родительского комитета средней школы моего ребенка, мы работаем в условиях ограниченного бюджета государственного учебного заведения и поэтому каждый год проводим мероприятие по сбору средств. Используя функцию преобразования текста в шаблон, я смог загрузить наш логотип и указать желаемый дизайн. Был автоматически сгенерирован ряд вариантов дизайна, позволяя мне адаптировать один из них под нужную винтажную морскую тему. Менее чем за минуту у меня появилась перспективная концепция плаката – существенное сокращение времени по сравнению с его созданием вручную, которое заняло бы около часа. Этот шаблон является ценным ресурсом для волонтеров вроде меня.

Для чего это?

Подводя итог, исследование Firefly оказалось довольно продуктивным, но полным отклонений от намеченного пути. То, что не было затронуто в обсуждении — это множество странных экспериментов, которые не всегда служили конкретной цели. Используя свою креативность и расширяя границы возможностей этого инструмента, я осознал его потенциал – и насколько узок был мой взгляд на то, для чего он может быть полезен.

Мой самый нервирующий эксперимент заключался в использовании упомянутого инструмента преобразования изображения в видео. Я загрузил фотографию моей жены, сидящей на стуле с нашим котом, который устроился у нее на коленях. Я поручил ИИ заставить кота повернуть голову и прыгнуть к камере, вызвав падение последней. Мне казалось, что это задание поставит AI в тупик из-за нарушения четвертой стены или попытки оживить нашего двумерного полосатого кошачьего. Однако результатом стало видео, где мой настоящий кот с некоторой неловкостью повернул голову от неподвижного изображения и бросился на камеру. Как и ожидалось, камера упала, и запись закончилась.

Я не могу объяснить, почему это так сильно повлияло на меня, но оно затронуло мои чувства, и я удалил видео. Через неделю я взял своего ребёнка в то же место, надеясь повторить ту волшебную способность оживлять нашу кошку через фото. Просматривая изображения кошек, он заметил одну из наших кошкек в шапке Санты и попросил превратить её в Санта-Клауса. Для него это было как само собой разумеющееся. Так что я согласился, и результат удивил всех нас неожиданной волной смеха.

B этой версии я попытался использовать более простые конструкции предложений и естественный язык, чтобы передать оригинальный смысл текста.

Вопрос заключается в том, что можно сделать с «этим»? Честно говоря, это удивительно и не соответствует моим первоначальным предположениям; просто странно. Признаюсь, размышлять о практическом использовании стремительно развивающейся технологии вроде генеративного ИИ-искусства кажется довольно бессмысленным занятием. Например, он мог бы оживить фотографию моего старого кота, пусть даже на мгновение, распознав его кошачьи черты и сделав живым. Хотя инструменты типа Adobe Firefly обладают осязаемыми преимуществами для обычных пользователей — таких как помощь в создании плакатов, вдохновении персонажей, разработке модных концептов и восстановлении фотографий — меня по-настоящему завораживают более необычные применения в области генеративного искусства. Полезны ли эти приложения? Я не уверен, что это правильный вопрос. Вместо этого кажется, что творческие умы просто исследуют неизвестное.

Смотрите также

2025-03-19 22:01