Как делается Textual Inversion уже писал во второй части своих гайдов по Stable Diffusion, но сейчас появилась интересная опция Gradient Accumulation, неплохо ускоряющая обучение - (как я понял), требуемых шагов для хорошего результата нужно меньше за счет того, что поиск в модели лучшего варианта для эмбеддинга идет не после каждого изображения, а после обработки результатов нескольких изображений сразу.
Чот угарнул, что у нее купальник из волос. Чзх она Байонетта???
Попробую обучить на датасете.
Предыдущие попытки сделать свой эмбеддинг не сказать что были удачными - я прогнал выборку из десятка картинок через anything v3 через 100к шагов, на выходе получив белиберду. Думал что это из за видюхи(3070ti), а тут люди на 1080 учат, и ничего... Кажется нужно попробовать ещё раз.
Я хз что не так с моими эмбдингами. Вот мой промежуточный результат на 1500 шагов, мальца как то не то что у ОПа, да?
Используй гиперсетку или дримботх. От 5К шагов тестируй результат. Там по умолчанию модель каждые 500 шагов сохраняется
забрал открывающую картинку на рабочий стол(ы)
За такое подарок - радостная Уэнсдей (по мнению сети)
Есть же раздел специальный для нейронок