Для тех кто не в курсе - это что-то вроде моделей Interrogate, но специализирующиеся именно на тэгах (которые можно потом обрабатывать в автоматических нодах). Разобраться бы еще как мультимодельные модели LLM работают... #comfyui
как мультимодельные модели LLM работаютПримерно как и обычные. Даёшь картинку, в промте пишешь describe that image и получаешь описание.
Не пробовал "эстетические" вопросы таким моделям задвать? Вроде правильности отображения пальцев на руке и общей композиции картины? )))
https://www.bigfooty.com/forum/media/alive-itsalive-gif.10785/full
Вот вот. А что там получше? Какие модели стоит посмотреть?