Изучая искусственный интеллект (аналитическая записка №1)
Задача: проанализировать возможности искусственного интеллекта, ориентированного на создание визуальных решений.
Мы живём в удивительное время парадигмальных сдвигов!
Современный искусственный интеллект постепенно учится выполнять функциональные задачи, которые раньше были прерогативой человека. Вчера была уверенность в том, что последний «бастион», художественная деятельность — ещё долго не будет взят, и наше поколение, а возможно и следующее, успеет потрудиться в контексте «классической» парадигмы. Но, видимо, прогнозировать развитие искусственного интеллекта нужно было не по арифметической прогрессии, а по экспоненте.
Сегодня множество различных нейронных сетей способны генерировать изображения по словесному описанию: Photosonic, Dall-e 2, Stable Diffusion, NightCafe, Jasper Art и др. Процесс прост: пользователь-человек записывает набор ключевых слов (тегов, промт-подсказок), а нейронная сеть генерирует изображение на основе заданной семантики. Чем точнее описание, тем лучше соотносятся между собой набор ключевых слов и полученное визуальное решение.
О подобных нейронных сетях написано много, но раньше результат генерации был либо явно отличным от создаваемых человеком визуальных решений (нейронная сеть, как бы сразу выдавала свою искусственную природу), либо некорректным с изобразительной точки зрения (присутствовали искажения, которые человек вряд ли допустил бы). Соответственно, художник мог чувствовать себя относительно спокойно — зная, что машина ещё не освоила изобразительную грамоту. Однако всё изменилось в течение последних нескольких месяцев 2022 года, после выхода 4-й версии нейронной сети MidJourney.
Сегодня нейронная сеть MidJourney способна создавать (генерировать) очень интересные визуальные решения. В этом эссе намеренно не употребляются такие понятия как: «качественные» вместо «интересные» и «произведение» вместо «визуальное решение», т. к. подобные термины требуют более детальных исследований, в том числе содержания визуальных решений.
Для постановки проблемы и первичного, наглядного изучения состояния дел — проведено небольшое исследование. Были отобраны 10 сгенерированных визуальных решений, созданных различными пользователями. Изображения взяты из сообщества в социальной сети ВКонтакте (https://vk.com/mid.journey).
Изображения были отобраны по следующим техническим, визуальным и тематическим критериям:
• без изобразительных искажений — различных бессмысленных и бессистемных трансформаций основных (доминанты) или дополнительных (субдоминант) объектов визуального решения;
• без стилизации — например, создания графического или живописного визуального решения по фотографии;
• без киберпанка, стимпанка, сюрреализма и т. п. визуальных решений, чтобы не возникло иллюзии, что MidJourney может генерировать исключительно контент подобного рода. Уклон при отборе был сделан в сторону традиционного (классического) и понятного (с изобразительной точки зрения);
• побольше разнообразных живописных, графических и декоративных техник.
После отбора был проведен поиск визуальных решений в Яндекс-картинках, для исключения возможности прямого заимствования работ художников.
Основной вывод: нейросеть MidJourney — феномен, который способен осуществить парадигмальный сдвиг в сфере художественного творчества. Создание MidJourney, и других подобных нейронных сетей, напоминает изобретение фотографии, после которого постепенно начали формироваться различные «измы», позволившие отграничить художественный гений человека от задачи реалистичной фиксации окружающей действительности.
Да, 10 изображений маловато, чтобы максимально широко представить феномен, но цель мини-исследования заключалась исключительно в постановке проблемы. Да, для более конкретных выводов потребуются более детальные исследования, в том числе по направлению коммуникативного дизайна. Однако несмотря на эти уточнения, создатели нейросети бросили жребий и Рубикон перейден...