Self-discipline trap with Suno AI

Чуть больше года назад, общаясь ещё с GPT-3.5, в конце диалога про рабочесть-нерабочесть разных механик личностной мотивации решил себя развлечь и попросил нейронку резюмировать беседу в стихотворную форму на английском. На английском, потому что рифмовать строки на русском нейронки от OpenAI тогда ещё не умели. И даже смог подобрать музыку, под которую мне бы хотелось услышать зачитанный текст:

Первый трек из этого сборника, расширенный для двух куплетов с двумя припевами

К сожалению, ни петь, ни читать рэп я не умел и сохранил этот текст на потом.

И вот, когда-то потом (буквально вчера) внезапно вспомнил про этот текст, и про то, что у меня через Syntx AI есть доступ к Suno AI — нейросетке, генерирующей музыку и песни.

Одна из первых попыток вышла довольно приятной, довольно удачной (как я потом узнал, даже очень удачной), но по стилю это было вообще не то, что задумывалось изначально.

Там же, внутри телеграм-бота Syntx, переключаемся на быструю языковую нейросеть Claude 3 Haiku, спрашиваем список тегов для японской музыки и список известных музыкальных инструментов.

Self-discipline trap with Suno AI

Проверил первые инструменты по ютубу — первый инструмент то мне и нужен!

Докидываем в стили shamisen; добавляем aggressive, electronic, phonk для стиля и быстрого темпа; а также меняем вокал на женский и добавляем chorus (хор) для глубины.

Десятая генерация уже очень близка к изначальной задумке, но... звучит довольно стандартно для такого жанра. Да, вкусно, но хочется красивый топпинг сверху.

Отправляем текст на переработку в GPT-4 Omni для переработки по её усмотрению (напомню, что оригинал был собран вручную из промптов GPT-3.5, а это уже позапрошлая версия). Также играемся со стилями. И на шестнадцатую генерацию получаем шедевр 😎

Особенности Suno

Главная её проблема — она слишком хаотичная! Даже посылая в неё одинаковый текст и одинаковый набор тегов стиля можно получить слишком разный результат. Но это не главная беда: если помните, я говорил, что третий трек был крайне удачным. Десятый и шестнадцатый тоже очень везучие треки.

А всё потому, что Suno может закончить трек тогда, когда сама захочет, а не тогда, когда закончится весь текст. Или же, что, правда, лучше, оставить довольно длинный проигрышь в конце, после текста. После общения с графической Stable Diffusion, в которой ты можешь невероятно тонко настроить все аспекты генерации, тут инструментарий очень скуден.

Следующий трек уже получился тогда, когда я начал экспериментировать с убиранием тегов стиля из шедевральной версии.

Этот трек был собран из трёх кусков — переходы можно заметить на видео. Suno сначала проигнорировала целый кусок текста. В продолжении проигнорировала эпилог. Догенерировали эпилог и вот теперь можем всё собрать в единую композицию.

Кстати про хаотичность: эта версия и шедевральная различаются отсутствием всего ОДНОГО тега стиля. Звучат при этом абсолютно по разному, а часть тегов вообще проигнорирована.

Но попробовать точно стоит

Особенно если у вас есть тетрадочка собственно писанных стихов — если разбираетесь в музыкальных жанрах и инструментах, то можете получить много удовольствия. Я сижу на базовой подписке, с безлимитом на простые языковые нейронки, лимитом на продвинутые и достаточным запасом токенов, чтобы иногда чо то сгенерировать. У языковых нейронок как раз сможете посоветоваться по поводу музыкальных стилей и инструментов.

Текст для ленты

Исполнил мечту годовой давности и услышал, как звучит написанный ещё в ChatGPT-3.5 трэп. Другие варианты трека и о процессе генерации в Suno AI через Syntx AI внутри статьи.

11
Начать дискуссию