IF: нейросеть, которая умеет в руки и текст

Синтез изображений из текста прошел долгий путь от появления DALL-E до Stable Diffusion. Несколько дней назад был открыт код большой (4.3 млрд параметров) модели для генерации изображений, которая привлекла внимание своим новым подходом к генерации - DeepFloyd IF. В этой статье я кратко рассмотрю архитектуру модели, ее возможности и приведу примеры…

IF: нейросеть, которая умеет в руки и текст
4545

Жесть какая. Со стороны смотрится, как попытка продать типа ново изобретённый велосипед людям, что давно уже на элитных байках катаются. Она же нифига не может и в ней нифига нету.

2