Искусственный интеллект в медиа: где он обитает и как с ним подружиться

Искусственный интеллект в медиа: где он обитает и как с ним подружиться

Искусственный интеллект — тема самых оживленных дискуссий последних лет. Одни называют его залогом свободного доступа к творчеству, другие видят в нем предвестника апокалипсиса, третьи помахивают сборником законов об авторском праве. Можно быть сторонником любого из этих лагерей, но сам факт такого разделения говорит о том, что нейросети вошли в нашу жизнь по-серьезному и надолго.

Фантасты обещали нам мир, в котором роботы будут заниматься тяжелой работой, а людям останутся искусство и гедонизм. По факту, ИИ активнее всего развивается как раз в сферах, связанных с творчеством и интеллектуальной работой. Неужели нас обманули? Или человек и машина все-таки могут научится жить и творить совместно? Попробуем найти ответ на эти вопросы, рассмотрев актуальные технологии в медиа.

Как мы относимся к искусственному интеллекту в творчестве?

Фантастический прогресс генеративных ИИ произошел буквально у нас на глазах. Еще пару лет назад нейросети были игрушками для создания абсурдных мемов. Сегодня с их помощью можно делать что угодно — от реалистичных изображений и убедительных текстов до вполне сносно звучащих музыкальных треков и какого-то подобия анимации.

Но не всех устраивает такое положение вещей. Очевидно, что против развития генеративных нейросетей выступают представители творческих профессий — художники, дизайнеры и просто любители рисовать. К тому же, многие популярные сегодня ИИ обучены на массивах данных, в которые вошли работы авторов, не дававших на это свое согласие. Даже намеки на нечестную игру способны обрушить репутацию целых корпораций. В центре такого скандала сейчас оказалась Adobe, которую подозревают в сборе данных напрямую с компьютеров своих пользователей.

Как правило, без восторга нейросетевые арты воспринимает и аудитория. В этом году использование искусственного интеллекта заметили, например, в аналоговом хорроре «Полночь с дьяволом». Создатели сгенерировали несколько статичных заставок, которые появляются по ходу сюжета фильма, стилизованного под телепередачу из 70-х. Это вызвало волну возмущения со стороны зрителей, хоть и не повлияло на теплый прием картины. А вот в случае с заставкой сериала «Секретное вторжение» и вторым сезоном «Локи», где ИИ-арт появился на постере, использование генеративных технологий стало для зрителей скорее еще одним поводом пренебрегать этими проектами Marvel.

Источник: The Walt Disney Company
Источник: The Walt Disney Company

Эти истории говорят о негативном отношении о применении искусственного интеллекта в сферах, связанных с творчеством. Но чем оно обосновано и всегда ли зрители реально могут отличить настоящее искусство от созданного машиной? К изучению этого феномена и нашей реакции на него подключились исследователи, которые обнаружили несколько любопытных фактов.

Одно из исследований подтвердило, что мы действительно предвзято относимся к контенту, если знаем, что он был создан нейросетями. Нам, как зрителям, в искусстве важна не только эстетика и красота, но и ценность — вложенный создателем смысл и его личный опыт. Эти факторы должны служить свидетельством мастерства и «человечности» — поэтому участники эксперимента отвергали ИИ-изображения и положительно оценивали картинки, помеченные как созданные людьми. Ирония в том, что все использованные в данном исследовании арты были созданы с помощью ИИ-инструментов.

В другом эксперименте участников попросили оценить несколько текстов коммерческой и социальной направленности. На этот раз действительно использовались тексты, созданные как машинами, так и людьми, но читатели не знали конкретных авторов. В итоге наиболее убедительными, по мнению участников, оказались тексты, сгенерированные или модифицированные ИИ.

Можно ли считать это тревожным звоночком для поэтов и писателей? Вряд ли — тексты в исследовании были написаны по конкретной формуле, призванной заставить человека совершить определенное действие. А если ИИ в чем-то и превосходит человека, так это в том, чтобы механически выдавать стандартный контент, повторяющий заезженные формулы из учебников.

Генеративные технологии в музыке

Музыкальные нейросети по своей сути мало чем отличаются от текстовых и визуальных — они точно так же воспроизводят данные, на которых были обучены, и повторяют существующие паттерны. Их развитие проходило чуть медленнее из-за сложности аудиоформата, но в этом году генерация музыки вышла на уровень, сравнимый с актуальными версиями Midjourney и ChatGPT.

Причиной такого скачка стали нейросети Suno и Udio. Обе платформы набрали популярность в начале прошлого года и быстро стали новым развлечением для масс, успевших устать от искусственных картинок. По оценкам владельцев, в Udio ежедневно генерируется почти миллион треков, а Suno собирается зарабатывать до 120 миллиардов долларов в год.

Искусственный интеллект в медиа: где он обитает и как с ним подружиться

При этом ни одна из компаний не раскрывает данные о том, как обучала свои алгоритмы. К разгадке, кажется, приблизились пользователи. Если ввести в поле генерации название известной группы или популярного артиста, как минимум один из результатов будет максимально похож на исходных музыкантов — вплоть до конкретных фрагментов, голосов или текстов песен.

Мы провели собственный эксперимент и попросили Udio создать трек в стиле Depeche Mode. Нейросеть предупредила о том, что не имитирует существующих исполнителей, и тут же с точностью определила требуемый жанр и набор инструментов — вплоть до голоса Дэйва Гаана. Suno тоже отлично разбирается в жанрах и общей атмосфере артистов, но настолько близкие результаты она всё же не выдает — а на имена вроде Тейлор Свифт в ней и вовсе стоит запрет.

Почему это важно? Обучение нейросетей — юридически серая зона, в которой пока что отсутствует прозрачная этика. Даже если сознательно избегать прямых подражаний, выдача ИИ всё равно основана на том, что уже существует, — и, велика вероятность, попало в базу данных без ведома автора. Немало любителей и профессионалов против своей воли оказались вовлечены в разработку художественных нейросетей — сейчас в такой роли себя обнаруживают и музыканты самых разных мастей.

Законодательное творчество развивается гораздо медленнее, чем технологии, которое оно должно регулировать. До появления справедливых законов, которым должны будут следовать создатели ИИ-платформ, на этом рынке продолжит царить Дикий Запад. Дело в свои руки постепенно берут крупные контент-площадки и независимые разработчики. Instagram недавно ввел автоматическую (и пока что неидеальную) маркировку ИИ-изображений, а YouTube планирует ввести аналогичную систему для видео. Компания Ircam в свою очередь создала инструмент для распознавания сгенерированного аудио, который должен предотвращать его попадание на стриминги. На фоне этого вспоминается одна недавняя история — житель Северной Каролины создал сотни тысяч искусственно сгенерированных песен и распространял их через ведущие музыкальные сервисы, включая Spotify, Apple Music и Amazon Music. Ему удалось заработать не менее 10 миллионов долларов, манипулируя системой роялти и создавая иллюзию популярности среди несуществующих слушателей.

ИИ как компаньон

Даже если игнорировать этические вопросы применения генеративных нейросетей, их основной минус заключается в ограниченной степени контроля над результатом. Пользователь может задать направление и изменять параметры, чтобы добиться наиболее подходящей ему выдачи, но даже это несравнимо с полноценным творческим процессом. Человек здесь выполняет роль оператора станка, который нажимает на кнопку и смотрит на работу алгоритмов. Поэтому для большинства пользователей те же Udio и Suno — не больше, чем игрушка для создания мемов.

К счастью, разработчики софта могут предложить немало вариантов для по-настоящему креативной работы. Очень впечатляюще выглядят презентации сервиса Audimee, который позволяет трансформировать записи голоса в полноценные инструментальные дорожки. Наверняка многие начинающие музыканты и продюсеры согласятся с тем, что было бы здорово просто напеть мелодию и сделать из этого полноценный трек — теперь это становится возможным с помощью технологий.

Сайты вроде Lalal.ai и Tunebat могут помочь с другими задачами — разбить существующий трек на отдельные дорожки, узнать его темп и даже настроение. Это полезно для диджеев, продюсеров ремиксов или начинающих музыкантов, которые изучают партии инструментов, на которых учатся играть. Конечно, есть множество проверенных временем способов сделать то же самое своими силами, но облегчать обучение и помогать развивать креативные навыки — одна из самых благородных задач современных технологий.

Искусственный интеллект в медиа: где он обитает и как с ним подружиться

Наконец, есть и инструменты, способные автоматически сводить и мастерить треки. Мастеринг тоже входит в число проблем, с которыми сталкивается любой DIY-музыкант. Когда никак не получается заставить свои треки звучать хорошо, это может убить весь энтузиазм заниматься музыкой. Финальная обработка треков — гораздо более технический процесс, чем творческий, и многие артисты лишены необходимых навыков или желания их осваивать. Возможно, именно благодаря ИИ многие проекты, пылящиеся на жестких дисках, смогут увидеть свет дня.

ИИ-технологии применяются и в самых разных плагинах для DAW — например, для модуляции эффектов, исправления вокальных партий, создания сложного звукового дизайна. Конечно, и такие технологии могут вызвать негодование у части людей. Кто-то назовет их «читерством», кто-то задумается о рабочих местах звукорежиссеров и сессионных музыкантов. Чего в этом больше — рисков для профессионалов или возможностей для любителей, покажет только время.

Нейросети для потребителей

Выше мы говорили о применении ИИ только в контексте творчества. Но ведь есть и его потребители, которые составляют куда большую аудиторию и поэтому не менее интересны рынку. Стриминги и другие платформы вовсю применяют искусственный интеллект, чтобы оптимизировать поиск контента, облегчить его восприятие — и даже создавать новый по запросу пользователя.

Пожалуй, самым ярким примером является Spotify. На этом стриминге уже давно интегрирована система пользовательских рекомендаций, основанная на анализе предпочтений и поиске похожих треков. Похожую услугу, но уже в профессиональной среде предоставляет сервис по лицензированию музыки Musicbed, в котором есть функция поиска по идентичным фрагментам — например, если режиссер фильма захочет заменить трек-плейсхолдер чем-то, максимально на него похожим.

Прошлой весной в Spotify появилась функция по созданию ИИ-плейлистов — достаточно ввести текстовый запрос, как в ChatGPT, и платформа автоматически предложит подборку песен, подходящих по настроению, тематике и любым другим параметрам. Также в прошлом году был представлен ИИ-диджей, создающий иллюзию вашей собственной персональной радиостанции с говорящим ведущим — впрочем, независимыми разработчиками из Radiant такая идея была реализована на несколько лет раньше и без обязательной подписки.

Набирает оборот и локализация контента с помощью нейросетей. YouTube и TikTok уже давно ввели автоматическую генерацию субтитров, которой авторы видео пользуются, чтобы создавать сопровождающий текст в коротких видео. Развивается и автоматический перевод — за рубежом популярна ElevenLabs, а свежие версии российского Яндекс.Браузера позволяют смотреть любые видео в нейросетевом дубляже и с локализованными субтитрами.

Источник: YouTube-канал Dr. Mix
Источник: YouTube-канал Dr. Mix

Что ждет нас в будущем

Как и у любого технологического новшества, у ИИ есть как восторженные поклонники, так и непримиримые противники. Всё чаще звучат разговоры о необходимости регулировать развитие технологий и маркировать созданный нейросетями контент — но с еще большей скоростью растет количество пользователей ИИ-платформ и качество их выдачи. Еще в начале прошлого года никто не относился серьезно к Udio и Suno, а пользователи всего лишь экспериментировали с формами и клепали мемы. Ситуация изменилась быстрее, чем могло бы показаться — сегодня на YouTube уже вовсю набирают слушателей артисты, которые делают в нейросетях всё, начиная от текстов и заканчивая обложками.

Скептики ударяются в спекуляции о том, что нынешний уровень развития технологий скоро позволит стриминговым платформам и другим корпорациям заменить реальных артистов на алгоритмы создания музыки по запросу, чтобы окончательно перестать платить и без того скромные роялти. Глава Spotify Даниэль Эк от таких планов открещивается, но уже успел заявить, что ИИ-музыка на его платформе приветствуется в разумных пределах.

С другой стороны, нельзя отрицать, что прогресс упрощает доступ к созданию музыки. Чуть больше века назад для занятий творчеством было необходимо получить профильное образование, но появление доступных инструментов и способов звукозаписи произвело революцию и смело почти все ограничения. Теперь их становится еще меньше — как для авторов, так и для слушателей. К чему приведет нас новый виток истории, мы увидим уже совсем скоро.

4
Начать дискуссию