Результаты эксперимента с генерацией фотографий

Как и обещал возвращаюсь к вам с результатами моего вчерашнего эксперимента, а именно сколько людей сможет отличить настоящую фотографию от сгенерированной. Я агрегировал все результаты с моего канала + DTF и вот, что получилось (изображение в конце поста).

Результаты эксперимента с генерацией фотографий

Правильный ответ

Настоящей фотографии среди всех вариантов не было. Внимательные подписчики вероятно заметили, что принимаются не только варианты в голосовалке, но и в комменариях. Сделал я это намеренно, так как иначе было бы слишком очевидно, что настоящей фотографии нет и эксперимент бы провалился. Во всяком случае мне так показалось, но возможно я ошибаюсь.

Вывод, который я сделал по результатам эксперимента

Отличить реальную фотографию от сгенерированной уже на этом этапе обучения нейросети становится сложно. В голову закрадываются сомнения, быть уверенным в выборе трудно. На следующих версиях нейросетей это, вероятно, будет практически не возможно. А значит этот инструмент можно будет применять в работе, например, вместо стоков. Куда проще написать, что тебе нужно, чем искать 40-50 минут на стоке идеальную фотографию.

А теперь обещанный гайд, какой prompt я прописывал

  • Я добавлял в конец prompt’а тип пленки и на мой взгляд это было наиболее важным фактором, что бы нейросеть понимала, что нужна реалистичная фотография. Например: Fujifilm Pro 400H, Agfa Vista Plus 200, Konica Infrared 750, Kodak vision3 500T и т.д. Если вы не фотограф (как и я) и не разбираетесь в типах пленки, то используйте гугл ChatGPT и она вам выдаст готовый список.
  • В начале prompt’a я задавал объект и какой стиль одежды я ожидаю увидеть. Например: street style photo of a woman, classic style photo of a woman, sporty style photo of a woman и т.д. Если вы не сильны и в fashion стилях, то просто используйте гугл ChatGPT.
  • В середине prompt’a я указывал дополнительные атрибуты или локацию. Например: sunny day, Moscow street, walking down the street, a shot where the subject is framed from the waist up и т.д.
  • Еще можно указать какой свет вы хотите видеть на фотографии. Можно прямо так и написать: Natural Lightning или Studio Lightning и т.д.
  • Если вам нужен определенный ракурс кадра или расстояние, то можно так и написать: Low-Angle Shot, High-Angle Shot, Closeup Shot и т.д.
  • В самом конце prompt’а я указывал версию --v 4 и уменьшал стилизацию --stylize 50

Итого у меня получался примерно вот такой prompt, который я варьировал в зависимости от того, что хотел увидеть на фотографии:

/imagine prompt street style photo of a woman, a shot where the subject is framed from the waist up, walking down the street, sunny day, Moscow street, High-Angle shot, Natural Lightning, shot on Fujifilm Pro 400H --stylize 50 --v 4

Ну и по традиции — подписывайтесь на мой телеграм канал, если не хотите пропустить следующий конкурсов и быть в курсе движухи по нейросетям :)

Благодарю всех, кто поучаствовал.

4
18 комментариев