Анализ изображений с помощью моделей для создания тэгов (comfyui)

Для тех кто не в курсе - это что-то вроде моделей Interrogate, но специализирующиеся именно на тэгах (которые можно потом обрабатывать в автоматических нодах).

Разобраться бы еще как мультимодельные модели LLM работают...

22
14 комментариев

как мультимодельные модели LLM работаютПримерно как и обычные. Даёшь картинку, в промте пишешь describe that image и получаешь описание.

Ответить

Не пробовал "эстетические" вопросы таким моделям задвать? Вроде правильности отображения пальцев на руке и общей композиции картины? )))
https://www.bigfooty.com/forum/media/alive-itsalive-gif.10785/full

1
Ответить

Вот вот. А что там получше? Какие модели стоит посмотреть?

1
Ответить