IF: нейросеть, которая умеет в руки и текст

Синтез изображений из текста прошел долгий путь от появления DALL-E до Stable Diffusion. Несколько дней назад был открыт код большой (4.3 млрд параметров) модели для генерации изображений, которая привлекла внимание своим новым подходом к генерации - DeepFloyd IF. В этой статье я кратко рассмотрю архитектуру модели, ее возможности и приведу примеры…

IF: нейросеть, которая умеет в руки и текст
4545

состоящая из кодера замороженного текста и трех каскадных модулей диффузии пикселейМ-ммм?

Ответить

М-ггг...

Ответить