IF: нейросеть, которая умеет в руки и текст

Синтез изображений из текста прошел долгий путь от появления DALL-E до Stable Diffusion. Несколько дней назад был открыт код большой (4.3 млрд параметров) модели для генерации изображений, которая привлекла внимание своим новым подходом к генерации - DeepFloyd IF. В этой статье я кратко рассмотрю архитектуру модели, ее возможности и приведу примеры…

IF: нейросеть, которая умеет в руки и текст
4545

Так, ну это всё хорошо, а, так сказать, фотокарточки с холыми бабами будут?

5

Это надо локально либо на гугл коллабе ставить и пробовать может ли она их рисовать, но и там и там видеопамяти чтобы попробовать не хватает